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容 提 要 


本 书 是 数据 结构 与 算法 的 入 门 指南 ， 不 局 限于 某 种 特定 语言 ， 略 过 复杂 的 数学 公式 ， 用 通俗 易 懂 的 方 
介绍 数据 结构 与 算法 的 基本 概念 ， 培 养 读者 编程 逻辑 。 主 要 内 容 包 括 : 为 什么 要 了 解数 


式 针对 编程 初学 者 
据 结 构 与 算法 ， 大 
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O 表示 法 及 其 代码 优化 利用 ， 




















栈 、 队 列 等 的 合理 使 用 ， 等 等 。 





本 书 适 合 编程 初学 者 、 非 计算 机 专业 出 身 的 程序 员 等 阅读 。 
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数据 结构 与 算法 并 不 只 是 抽象 的 概念 , 掌握 好 的 话 可 以 写 出 更 高 效 、 运 行 得 更 快 的 代码 , 这 
对 于 如 今 盛行 的 网 页 和 移动 应 用 开发 来 说 尤为 重要 。 如 果 你 最 近 一 次 使 用 算法 是 在 大 学 课堂 上 或 
求职 面试 时 ， 那 你 应 该 还 没 见 识 到 它 的 真正 威力 。 

这 个 主题 的 大 多 数 资 料 都 有 一 种 通病 一 一 聊 涩 难 风 。 满 纸 的 数学 术语 ， 搞 得 除非 你 是 数学 家 ， 
不 然 真 不 知道 作者 在 说 什么 。 即 使 是 一 些 声称 “简化 ”过 的 书 ,， 看 起 来 也 好 像 已 经 认定 读者 都 掌握 
了 高 深 的 数学 知识 。 这 就 导致 了 很 多 人 对 此 主题 望 而 生 綦 ， 以 为 自己 的 智商 不 足以 理解 这 些 概念 。 

但 事实 上 , 数据 结构 与 算法 都 是 能 够 从 常识 推导 出 来 的 。 数 学 符号 只 是 一 种 特定 的 语言 , 数 
学 里 的 一 切 都 是 可 以 用 常识 去 解释 的 。 本 书 用 到 的 数学 知识 就 只 有 加 减 乘除 和 指数 , 所 有 的 概念 
都 可 以 用 文字 来 解释 。 我 还 会 采用 大 量 的 图 表 以 便 读者 轻松 地 理解 。 

一 且 掌 握 了 这 些 知识 ， 你 就 能 写 出 高 效 、 快 速 、 优 雅 的 代码 。 你 还 能 权衡 各 种 写法 的 优 劣 ， 
并 能 合理 判断 适用 于 给 定 情况 的 最 优 方案 。 

一 些 读者 可 能 是 因为 学 校 开设 了 这 门 课 或 者 为 准备 技术 面试 而 阅读 本 书 的 。 本 书 对 计算 机 科 
学 基础 的 解释 能 有 效 地 帮助 你 达到 目的 。 此 外 , 我 还 鼓励 你 正视 这 些 概念 在 日 常 编程 中 的 实用 价 
值 。 为 此 ， 我 将 书 中 阐述 的 概念 与 实际 结合 ， 其 中 的 用 例 都 可 供 大 家 使 用 。 




















































































































目标 读者 
本 书 适合 以 下 读者 。 
口 有 编程 基础 的 初级 开发 者 ， 想 学 习 一 些 计算 机 科学 的 基本 概念 ， 以 优化 代码 ， 提 高 编程 
技能 。 





口 自学 编程 的 开发 者 ， 没 学 过 正规 的 计算 机 科学 课程 (或 者 学 过 但 忘 光 了 )， 现 在 想 利用 数 
据 结 构 与 算法 使 代码 更 灵活 、 更 具 扩 展 性 。 

口 计算 机 科学 专业 的 学 生 ， 和 希望 找到 用 简洁 语言 阐述 数据 结构 与 算法 的 资料 。 这 本 书 很 适 
合作 为 “经 典 ” 教 材 的 补充 参考 。 

口 开发 人 员 ， 平 时 也 许 没 怎么 利用 过 数据 结构 与 算法 的 知识 ,希望 复习 这 些 概 念 为 下 次 技 
术 面 试 做 准备 。 












































为 了 使 本 书 不 特定 于 某 种 语言 ， 我 们 的 示例 代码 会 用 到 多 种 语言 ， 包 括 Ruby、Python 和 
JavaScript， 了 解 这 些 语 言 的 话 可 能 会 学 得 更 快 。 不 过 , 这 些 示 例 代码 都 没有 严格 按照 惯用 语法 来 
写 , 避免 读者 因 看 不 懂 某 种 语言 的 特有 语法 而 困惑 。 所 以 即使 不 太 熟 悉 某 种 语言 ,也 还 是 能 跟 得 
上 的 。 














本 书 内 容 


本 书 的 主旨 就 是 数据 结构 与 算法 ， 具 体内 容 如 下 。 

第 1 章 和 第 2 章 , 解释 数据 结构 和 算法 是 什么 ,并 探索 时 间 复 杂 度 这 一 判断 算法 效率 的 概念 。 
此 过 程 中 还 会 经 常 提 及 数组 、 集 合 和 二 分 查找 。 

第 3 章 ， 以 老奶奶 都 听 得 懂 的 方式 去 揭示 大 0 记 法 的 本 质 。 因 为 大 O 记 法 全 书 都 会 用 到 ， 
所 以 对 这 一 章 的 理解 非常 重要 。 

第 4 章 、 第 5 章 和 第 6 章 , 进一步 探索 大 O 记 法 , 并 以 实例 来 演示 如 何 利 用 它 来 加 快 代码 运 
行 速度 。 这 一 路 上 ， 我 们 还 会 提 到 各 种 排序 算法 ,包括 冒 泡 排序 、 选 择 排 序 和 插入 排序 。 

第 7 章 和 第 8 章 会 再 探讨 几 种 数据 结构 ,包括 散 列 表 、 栈 和 队列 ， 展 示 它 们 对 代码 速度 和 可 
读 性 的 影响 ， 并 学 会 用 其 解决 实际 问题 。 
第 9 章 会 介绍 递归 ， 计 算 机 科学 中 的 核心 概念 。 我 们 会 对 其 进行 分 解 ， 考 察 它 在 某 些 问 题 上 
的 利用 价值 。 第 10 章 会 运用 递归 来 实现 一 些 飞 快 的 算法 ， 例 如 快速 排序 和 快速 选择 ， 提 升 读者 
的 算法 开发 能 

第 11 章 、 第 12 章 和 第 13 章 会 探索 基于 结 点 的 数据 结构 ， 包 括 链表 、 二 又 树 和 图 ， 并 展示 
它们 在 各 种 应 用 中 的 完美 表现 。 

最 后 一 章 ， 第 14 章 ， 介 绍 空间 复杂 度 。 当 程序 运行 环境 的 内 存 空 间 不 多 ， 或 处 理 的 数据 量 
很 大 时 ， 理 解 空间 复杂 度 便 显 得 特别 重要 。 













































































如 何 阅 读本 书 


你 得 按 顺序 从 第 1 章 开始 读 起 。 昌 然 有 些 书 允许 读者 单独 翻阅 某 些 章节 ， 或 跳 过 某 些 章节 ， 
但 这 本 不 是 。 本 书 的 每 一 章 都 假定 你 已 经 读 过 其 之 前 的 内 容 , 而 且 全 书 内 容 也 确实 是 精心 安排 的 ， 
使 得 你 在 按 序 阅 读 的 过 程 中 逐步 提高 认 知 水 平 。 

此 外 还 有 很 重要 的 一 点 : 为 了 易于 大 家 理解 ， 当 介绍 一 个 概念 时 , 我 可 能 不 会 把 它 一 下 子 全 
部 展露 出 来 。 有 时 候 ,， 理解 一 个 复杂 概念 的 最 好 方法 就 是 把 它 拆 分 成 小 块 ,并且 在 完全 明白 某 一 
块 以 后 才 去 着 手 其 他 部 分 。 要 是 我 在 描述 某 个 术语 时 说 得 比较 模糊 , 千 万 别 把 它 当 成 一 个 完整 的 
定义 ， 想 看 清 该 术语 的 全 貌 ， 你 得 读 完 关于 它 的 所 有 内 容 才 行 。 
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这 其 实 是 一 种 权衡 : 为 了 便于 理解 ， 我 只 能 把 一 个 概念 先 极 度 简化 ， 然 后 再 一 步 步 去 完善 。 
从 这 就 导致 了 有 些 句 子 写 得 不 够 彻底 、 不 够 学 术 , 或 不 够 精确 。 但 无 须 担 心 ， 因 为 到 最 后 你 一 
对 它 有 一 个 完整 的 印象 。 
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在 线 资源 
本 书 网 址 是 https://pragprog.com/book/jwdsal。 读 者 可 从 中 获取 更 多 关于 本 书 的 信息 ,或 以 下 
面 的 方式 互动 : 


口 在 ; 仑 坛 跟 其 他 读者 和 笔者 交流 
口 提交 勘误 ?， 改 进 本 书 。 


各 章 习 题 以 及 示例 代码 下 载 见 http:/commonsensecomputerscience.com 2 。 























电子 书 
扫描 如 下 二 维 码 ， 即 可 购买 本 书 电子 版 。 
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Q@ 本 书 中 文 版 勘误 请 到 http://ituring.cn/book/2538 查看 和 提交 。 编者 注 
@) 读者 也 可 以 到 图 灵 社 区 本 书页 面 下 载 示 例 代 码 ， 网 址 是 http://ituring.cn/book/2538。 一 一 编者 注 
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数据 结构 为 何 重要 















































哪怕 只 写 过 几 行 代码 的 人 都 会 发 现 ,编程 基本 上 就 是 在 跟 数 据 打 交道 。 计 算 机 程序 总 是 在 接 
收 数据 、 操 作 数据 或 返回 数据 。 不 管 是 求 两 数 之 和 的 小 程序 ,还 是 管理 公司 的 企业 级 软件 ， 都 运 
行 在 数据 之 上 。 

数据 是 一 个 广义 的 术语 ， 可 以 指 代 各 种 类 型 的 信息 ,包括 最 基本 的 数字 和 字符 串 。 在 经 典 的 
“Hello World!” 这 个 简单 程序 中 ， 字 符 串 "Hello World!" 就 是 一 条 数据 。 事 实 上 ， 无 论 是 多 么 
复杂 的 数据 ， 我 们 都 可 以 将 其 拆 成 一 扒 数 字 和 字符 串 来 看 待 。 

数据 结构 则 是 指数 据 的 组 织 形 式 。 看 看 以 下 代码 。 



























































x = "Hello!" 
y = "How are you" 
z = "today?" 


print x+ y+z 

这 个 非常 简单 的 程序 把 3 条 数据 串 成 了 一 句 连贯 的 话 。 如 果 要 描述 该 程序 中 的 数据 结构 ,我 
们 会 说 ， 这 里 有 3 个 独立 的 变量 ， 分 别 引用 着 3 个 独立 的 字符 串 。 

但 在 本 书 中 你 将 会 学 到 , 数据 结构 不 只 是 用 于 组 织 数据 , 它 还 极 大 地 影响 着 代码 的 运行 速度 。 
因为 数据 结构 不 同 ， 程 序 的 运行 速度 可 能 相差 多 个 数量 级 。 如 果 你 写 的 程序 要 处 理 大 量 的 数据 ， 
或 者 要 让 数 千 人 同时 使 用 , 那么 你 采用 何 种 数据 结构 , 将 决定 它 是 能 够 运行 ,还 是 会 因为 不 堪 重 
负 而 骨 演 。 

一 旦 对 各 种 数据 结构 有 了 深刻 的 理解 , 并 明白 它们 对 程序 性 能 方面 的 影响 , 你 就 能 写 出 快速 
而 优雅 的 代码 ， 从 而 使 软件 运行 得 快速 且 流 畅 。 当 然 ， 你 的 编程 技能 也 会 更 上 一 层 楼 。 

本 章 接 下 来 将 会 分 析 两 种 数据 结构 : 数组 和 和 集合。 它们 从 表面 上 看 好 像 差 不 多 , 但 通过 即将 
介绍 的 分 析 工 具 ， 你 将 会 观察 到 它们 在 性 能 上 的 差异 。 
























































1.1 基础 数据 结构 : 数组 
数组 是 计算 机 科学 中 最 基本 的 数据 结构 之 一 。 如果 你 用 过 数组 , 那么 应 该 知道 它 就 是 一 个 合 


























2 第 1 章 数据 结构 为 何 重要 














有 数据 的 列表 。 它 有 多 种 用 途 ， 适 用 于 各 种 场景 ， 下 面 就 举 个 简单 的 例子 。 
一 个 允许 用 户 创建 和 使 用 购物 清单 的 食 杂 店 应 用 软件 ， 其 源 代码 可 能 会 包含 以 下 的 片段 。 
array = ["apples", "bananas", "cucumbers", "dates", "elderberries"] 
这 就 是 一 个 数组 ， 它 刚好 包含 5 个 字符 串 ， 每 个 代表 我 会 从 超市 买 的 食物 。 
此 外 ， 我 们 会 用 一 些 名 为 索引 的 数字 来 标识 每 项 数据 在 数组 中 的 位 置 。 


在 大 多 数 的 编程 语言 中 ， 索 引 是 从 0 算 起 的 ， 因 此 在 这 个 例子 中 ，"apptLes" 的 索引 为 0， 
"eLderberries" 的 索引 为 4， 如 下 所 示 。 
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索引 0 索引 1 索引 2 索引 3 索引 4 
若 想 了 解 某 个 数据 结构 〈 例如 数组 ) 的 性 能 ， 得 分 析 程 序 怎样 操作 这 一 数据 结构 。 
一 般 数据 结构 都 有 以 下 4 种 操作 (或 者 说 用 法 )。 


口 读 取 : 查看 数据 结构 中 某 一 位 置 上 的 数据 。 对 于 数组 来 说 ， 这 意味 着 查看 某 个 索引 所 指 

的 数据 值 。 例 如 ， 查 看 索引 2 上 有 什么 食品 ， 就 是 一 种 读 取 。 

口 查找 : 从 数据 结构 中 找 出 某 个 数据 值 的 所 在 。 对 于 数组 来 说 ， 这 意味 着 检查 其 是 否 包 含 
某 个 值 , 如 果 包 含 , 那么 还 得 给 出 其 索引 。 例 如 , 检查 "dates" 是 否 存 在 于 食品 清单 之 中 ， 
给 出 其 对 应 的 索引 ， 就 是 一 种 查找 。 

口 插入 : 给 数据 结构 增加 一 个 数据 值 。 对 于 数组 来 说 ， 这 意味 着 多 加 一 个 格子 并 填 人 一 个 

值 。 例 如 ， 往 购物 清单 中 多 加 一 项 "figs" ， 就 是 一 种 插入。 

口 删除 : 从 数据 结构 中 移 走 一 个 数据 值 。 对 于 数组 来 说 ， 这 意味 着 把 数组 中 的 某 个 数据 项 
移 走 。 例 如 ， 把 购物 清单 中 的 "pananas" 移 走 ， 就 是 一 种 删除 。 

本 章 我 们 将 会 研究 这 些 操作 在 数组 上 的 运行 速度 。 

同时 ， 我 们 也 将 学 到 本 书 的 第 一 个 重要 理论 : 操作 的 速度 ， 并 不 按时 间 计 算 ， 而 是 按 步 数 
计算 。 

为 什么 呢 ? 


因为 ， 你 不 可 能 很 绝对 地 说 ， 某 项 操作 要 花 5 秒 。 它 在 某 台 机 器 上 要 跑 5 秒 ， 但 换 到 一 台 旧 
一 点 的 机 器 , 可 能 就 要 多 于 5 秒 , 而 换 到 一 台 未 来 的 超级 计算 机 , 运行 时 间 又 将 显著 缩短 。 所 以 ， 
受 硬件 影响 的 计时 方法 ， 非 常 不 可 靠 。 


然而 ， 若 按 步 数 来 算 ， 则 确切 得 多 。 如 果 A 操作 要 5 步 ，B 操作 要 500 步 ,那么 我 们 可 以 很 

























































































1.1 基础 数据 结构 : 数组 3 





























肯定 地 说 ， 无 论 是 在 什么 样 的 硬件 上 对 比 ，A 都 快 过 B。 因 此 ， 衡 量 步 数 是 分 析 速 度 的 关键 。 | 


此 外 ,操作 的 速度 ,也 常 被 称 为 时 间 复 杂 度 。 在 本 书 中 ,我 们 会 提 到 速度 、 时 间 复 杂 度 、 效 
率 、 性 能 ， 但 它们 其 实 指 的 都 是 步 数 。 


事 不 宜 迟 ， 我 们 现在 就 来 探索 上 述 4 种 操作 方式 在 数组 上 要 花 多 少 步 。 








1.1.1 读 取 
首先 看 看 读 取 ， 即 查看 数组 中 某 个 索引 所 指 的 数据 值 。 


这 只 要 一 步 就 够 了 ， 因 为 计算 机 本 身 就 有 跳 到 任 一 索引 位 置 的 能 力 。 在 ["apples"， 
"bananas"， "cucumbers"， "dates"， "elderberries"] 的 例子 中 ， 如 果 要 查看 索引 2 的 值 ， 
那么 计算 机 就 会 直接 跳 到 索引 2， 并 告诉 你 那里 有 "cucumbers"。 


计算 机 为 什么 能 一 步 到 位 呢 ? 原因 如 下 。 
计算 机 的 内 存 可 以 被 看 成 一 堆 格 子 。 下 图 是 一 片 网 格 , 其 中 有 些 格子 有 数据 , 有 些 则 是 空白 。 
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当 程 序 声明 一 个 数组 时 ， 它 会 先 划 分 出 一 些 连续 的 空格 子 以 备 使 用 。 换 句 话说， 如 果 你 想 创 
建 一 个 包含 5 个 元 素 的 数组 ， 计 算 机 就 会 找 出 5 个 排 成 一 行 的 空格 子 ， 将 其 当成 数组 。 
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内 存 中 的 每 个 格子 都 有 各 自 的 地 址 ， 就 像 街 道 地 址 , 例如 大 街 123 号 。 不 过 内 存 地 址 就 只 用 





一 个 普通 的 数字 来 表示 。 而 且 ， 每 个 格子 的 内 存 地 址 都 比 前 一 个 大 1， 如 下 图 所 示 。 
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购物 清单 数组 的 索引 和 内 存 地 址 ， 如 下 图 所 示 。 
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内 存 地 址 : 1016 
索引 : 0 1 2 3 4 
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计算 机 之 所 以 在 读 取 数 组 中 某 个 索引 所 指 的 值 时 , 能 直接 跳 到 那个 位 置 上 , 是 因为 它 具备 以 取 | 
下 条 件 。 


(1) 计算 机 可 以 一 步 就 跳 到 任意 一 个 内 存 地 址 上 。( 就 好 比 ， 要 是 你 知道 大 街 123 号 在 哪儿 ， 
那么 就 可 以 直 奔 过 去 。) 

(2) 数组 本 身 会 记 有 第 一 个 格子 的 内 存 地 址 ， 因 此 ， 计 算 机 知道 这 个 数组 的 开头 在 哪里 。 

(3) 数组 的 索引 从 0 算 起 。 

回 到 刚才 的 例子 ， 当 我 们 叫 计算 机 读 取 索引 3 的 值 时 ， 它 会 做 以 下 演算 。 

(1) 该 数组 的 索引 从 0 算 起 ， 其 开头 的 内 存 地址 为 1010。 

(2) 索引 3 在 索引 0 后 的 第 3 个 格子 上 。 

(3) 于 是 索引 3 的 内 存 地 址 为 1013， 因 为 1010 +3 = 1013。 

当 计算 机 一 步 跳 到 1013 时 ， 我 们 就 能 获取 到 "dates" 这 个 值 了 。 

所 以 , 数组 的 读 取 是 一 种 非常 高 效 的 操作 , 因为 它 只 要 一 步 就 好 ,一步 自然 也 是 最 快 的 速度 。 
这 种 一 步 读 取 任意 索引 的 能 力 ， 也 是 数组 好 用 的 原因 之 一 。 


如 果 我 们 问 的 不 是 “索引 3 有 什么 值 "， 而 是 “"dates" 在 不 在 数组 里 ”， 那 么 这 就 需要 进行 
查找 操作 了 。 下 面 我 们 就 来 看 看 。 










































































1.1.2 ”查找 

如 前 所 述 ， 对 于 数组 来 说 ， 查 找 就 是 检查 它 是 否 包含 某 个 值 ， 如 果 包 含 ， 还 得 给 出 其 索引 。 
那么 ,我们 就 试 试 在 数组 中 查找 "dates" 要 用 多 少 步 。 

对 于 我 们 人 来 说 , 可 以 一 眼 就 看 到 这 个 购物 清单 上 的 "dates"， 并 数 出 它 的 索引 为 3。 但是， 
计算 机 并 没有 眼睛 ， 它 只 能 一 步 一 步 地 检查 整个 数组 。 

想 要 查找 数组 中 是 否 存 在 某 个 值 , 计算 机 会 先 从 索引 0 开始 ,检查 其 值 ， 如 果 不 匹配 ， 则 继 
续 下 一 个 索引 ， 以 此 类 推 ， 直 至 找到 为 止 。 


我 们 用 以 下 图 来 演示 计算 机 如 何 从 购物 清单 中 查找 "dates"。 
首先 ， 计算机 检查 索引 0。 


0 1 2 4 
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因为 索引 0 的 值 是 "apptes" ， 并 非 我 们 所 要 的 "dates"， 所 以 计算 机 跳 到 下 一 个 索引 上 。 


0 1 2 3 4 


索引 1 也 不 是 "dates" ， 于 是 计算 机 再 跳 到 索引 2。 


0 2 ei 4 


但 索引 2 的 值 仍 不 匹配 ， 计 算 机 只 好 再 跳 到 下 一 格 。 
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0 1 p34 号 4 
啊 ， 真 是 千 辛 万 蔡 ， 我们 找到 "dates" 了 ， 它 就 在 索引 3 那里 。 自 此 ,计算 机 不 用 再 往 后 跳 
了 ， 因 为 结果 已 经 得 到 。 
在 这 个 例子 中 ， 因 为 我 们 检查 了 4 个 格子 才 找到 想 要 的 值 ， 所 以 这 次 操作 总 计 是 4 步 。 
这 种 逐个 格子 去 检查 的 做 法 ,就 是 最 基本 的 查找 方法 一 一 线性 查找 。 第 2 章 我 们 还 会 学 习 另 
一 种 查找 方法 。 
但 在 那 之 前 ,我 们 再 思考 一 下 ， 在 数组 上 进行 线性 查找 最 多 要 多 少 步 呢 ? 


如 果 我 们 要 找 的 值 刚 好 在 数组 的 最 后 一 个 格子 里 ( 如 本 例 的 eLderberries )， 那 么 计算 机 
从 头 到 尾 检 查 每 个 格子 ,会 在 最 后 才 找 到 。 同 样 ， 如 果 我 们 要 找 的 值 并 不 存在 于 数组 中 , 那么 计 
算 机 也 还 是 得 查 遍 每 个 格子 ， 才 能 确定 这 个 值 不 在 数组 中 。 


于 是 ,一 个 5 格 的 数组 , 其 线性 查找 的 步 数 最 大 值 是 $, 而 对 于 一 个 500 格 的 数组 , 则 是 500。 
以 此 类 推 , 一 个 NN 格 的 数组 ， 其 线性 查找 的 最 多 步 数 是 N (NN 可 以 是 任何 自然 数 )。 
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可 见 , 无 论 是 多 长 的 数组 ,查找 都 比 读 取 要 慢 ， 因 为 读 取 永远 都 只 需要 一 步 ， 而 查找 却 可 能 


接 下 来 ,我 们 再 研究 一 下 插入 ,准确 地 说 ， 是 插入 一 个 新 值 到 数组 之 中 。 












































1.1.3 插入 
往 数组 里 插入 一 个 新 元 素 的 速度 ， 取 决 于 你 想 把 它 插入 到 哪个 位 置 上 。 


假设 我 们 想 要 在 购物 清单 的 末尾 插入 "figs"。 那 么 只 需 一 步 。 因 为 之 前 说 过 了 ， 计 算 机 知 
道 数 组 开头 的 内 存 地 址 ， 也 知道 数组 包含 多 少 个 元 素 ， 所 以 可 以 算出 要 插入 的 内 存 地 址 ,然后 一 
步 跳 到 那里 插入 就 行 了 。 图 示 如 下 。 























"apples" "bananas" "cucumbers" "elderberries" 





1010 1011 1012 1013 1014 1015 


但 在 数组 开头 或 中 间 插 和 人, 就 男 当 别论 了 。 这 种 情况 下 , 我 们 需要 移动 其 他 元 素 以 腾 出 空间 ， 
于 是 得 花费 额外 的 步 数 。 


例如 往 索 引 2 处 插入 "figs"， 如 下 所 示 。 




















我 们 想 在 此 处 插入 "figs" 


内 存 中 后 续 的 一 格 
y 


"apples" "bananas" "cucumbers" "elderberries" 

















为 了 达到 目的 ， 我们 必须 先 把 "cucumbers"、"dates" 和 "elderberries" 往 右 移 ， 以 便 空 
出 索引 2。 而 这 也 不 是 一 步 就 能 移 好 ， 因 为 我 们 首先 要 将 "elderberries" 右 移 一 格 ， 以 空 出 位 
置 给 "dates"， 然 后 再 将 "dates" 右 移 ， 以 空 出 位 置 给 "cucumbers"， 下 面 来 演示 这 个 过 程 


汪 




















A 


第 1 步 : "elderberries" 右 移 。 
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[figs"] 





ba am ua 因 ea 


第 2 步 : "date" 右 移 。 


[figs"] 


Wel be ce Mb ee 


第 3 步 : "cucembers" 右 移 。 





[figs"] 


Bed es Wl es be ou 


第 4 步 : 至 此 ， 可 以 在 索引 2 处 插入 "figs" 了 。 


如 上 所 示 ， 整 个 过 程 有 4 步 ， 开 始 3 步 都 是 在 移动 数据 ， 剩 下 1 步 才 是 真正 的 搬入 数据 。 


最 低 效 ( 花费 最 多 步 数 ) 的 插入 是 插 人 在 数组 开头 。 因 为 这 时 候 需 要 把 数组 所 有 的 元 素 都 往 
右 移 。 


于 是 , 一 个 含有 N 个 元 素 的 数组 ， 其 搬入 数据 的 最 坏 情 况 会 花费 Y+ 1 步 。 即 插入 在 数组 开 
头 ， 导 致 Y 次 移动 , 加 上 一 次 插入。 


最 后 要 说 的 “删除 "， 则 相当 于 插入 的 反 向 操作 。 
















































































1.1.4 删除 
数组 的 删除 就 是 消 掉 其 某 个 索引 上 的 数据 。 
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我 们 找 回 最 开始 的 那个 数组 ， 删 除 索 引 2 上 的 值 ， 即 "cucumbers"。 也 | 


第 1 步 : 删除 "cucumbers"。 








"apples" "bananas" "elderberries" 





[= 


虽然 删除 "cucumbers" 好 像 一 步 就 搞定 了 , 但 这 种 来 了 新 的 问题 : 数组 中 间 空 出 了 一 个 格子 。 
为 数组 中 间 是 不 应 该 有 空格 的 ， 所 以 ， 我 们 得 把 "dates" 和 "elderberries" 往 左 移 。 


第 2 步 : 将 "dates" 左 移 。 











"apples" "bananas" "elderberries" 





第 3 步 : 将 "elderberries" 左 移 。 


"apples" "bananas" "elderberries" 





天 _ 一 
结果 ， 整 个 删除 操作 花 了 3 步 。 其 中 第 1 步 是 真正 的 删除 ， 剩 下 的 2 步 是 移 数据 去 填空 格 。 
所 以 ,删除 本 身 只 需要 1 步 , 但 接 下 来 需要 额外 的 步骤 将 数据 左 移 以 填补 删除 所 带 来 的 空隙 。 


跟 搬 和 一样, 删除 的 最 坏 情况 就 是 删 掉 数组 的 第 一 个 元 素 。 因 为 数组 不 允许 空 元 素 ， 当 索引 
0 空 出 ,那么 剩 下 的 所 有 元 素 都 要 往 左 移 去 填空 。 

对 于 含有 5 个 元 素 的 数组 , 删除 第 一 个 元 素 需要 1 步 , 左 移 剩余 的 元 素 需 要 4 步 。 而 对 于 500 
个 元 素 的 数组 ， 删 除 第 一 个 元 素 需 要 1 步 ， 左 移 剩 余 的 元 素 需 要 499 步 。 可 以 推出 ， 对 于 含有 N 
个 元 素 的 数组 ， 删 除 操作 最 多 需要 N 步 。 

既然 学 会 了 如 何 分 析 数 据 结构 的 时 间 复 杂 度 ， 那 就 可 以 开始 探索 各 种 数据 结构 的 性 能 差异 
了 。 了 解 这 些 非常 重要 ， 因 为 数据 结构 的 性 能 差异 会 直接 造成 程序 的 性 能 差异 。 


下 一 个 要 介绍 的 数据 结构 是 集合 , 它 跟 数 组 似乎 很 像 , 甚至 让 人 以 为 就 是 同一 种 东西 。 然 而 ， 
我 们 将 会 看 到 它 跟 数组 在 性 能 上 是 有 区 别 的 。 
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1.2 集合 


来 看 看 另 


其 实 集合 
区 

















: 一 条 规则 决定 性 能 





一 种 数据 结构 :集合 。 它 是 一 种 不 允许 























是 一 个 普通 的 




















要 是 你 想 
有 "b" 了 。 


集合 就 是 





元 素 列表 ， 唯 一 的 区 别 在 于 ， 集 合 不 允 


元 素 重复 的 数据 结构 。 





是 有 不 同形 式 的 , 但 现在 我 们 只 讨论 基于 数组 的 那 种 。 这 种 集合 跟 数 组 差不多 , 都 





许 插入 重复 的 值 。 








往 集 合 ["a"，"b"，"c"] 再 插入 一 个 "b"， 计 算 机 是 不 会 允许 的 ， 因 为 集合 中 已 经 


用 于 确保 数据 不 重复 。 


如 果 你 要 创建 一 个 线 上 电话 本 ,你 应 该 不 会 希望 相同 的 号 码 出 现 两 次 吧 。 事实 上 , 现在 我 的 





本 地 电话 本 高 
家 庭 ( 这 是 真 








不 过 , 估计 Zirkind 一 家 也 在 纳闷 为 什么 总 





it 有 这 种 状况 : 我 家 的 电话 号 码 不 单 指 问 


的 )。 接 上 听 那 些 要 找 Zirkind 的 电话 或 留 














我 这 里 ， 还 错误 地 指向 了 一 个 叫 Zirkind 的 
言 真 的 挺 烦 的 。 





是 接 不 到 电话 。 而 当 我 想 要 打 电 话 告 诉 Zirkind 号 
码 错 了 的 时 候 ， 我 妻子 就 会 去 接 电话 了 ， 因 为 我 拨 的 就 是 我 家 号 码 (好 吧 ， 这 是 开玩笑 )。 如 果 



































这 个 电话 本 程序 用 集合 来 处 理 ， 那 就 不 会 搞 出 这 种 麻烦 了 。 











总 之 , 集合 


本 操作 中 有 1 种 与 数组 性 能 不 同 
下 面 就 来 分 析 读 取 、 查 找 、 插 入 和 删除 在 基于 数组 的 集合 上 表现 如 何 。 


集合 的 读 


取 跟 数 组 的 读 取 完全 一 样 , 计算 机 只 要 





就 是 一 个 带 有 “不 允许 重复 ”这 种 简单 限制 的 数组 。 而 该 限制 也 导致 它 在 4 种 基 


步 就 能 获取 指定 索引 上 的 值 。 如 之 前 解释 








的 那样 ， 这 是 因为 计算 机 知道 集合 开头 的 内 存 地 址 ， 所 以 能 够 一 步 跳 到 集合 的 任意 索引 。 





集合 的 查 


找 也 跟 数组 的 查找 无 异 , 需要 N 步 去 检 





办 








需要 N 步 去 删除 和 左 移 填空 。 
但 插入 就 不 同 了 。 先 看 看 在 集合 末尾 的 插入 。 对 于 数组 来 说 ,末尾 插入 是 最 高 效 的 , 它 只 需 











要 1 步 。 
而 对 于 集合 
于 是 每 次 插入 都 要 先 来 一 次 查找 。 
假设 我 们 的 购物 清单 是 一 个 集合 一 一 用 集合 还 是 
当前 集合 是 ["apples"， "bananas",，"cucumbers"， 











查 某 个 值 在 不 在 集合 当中 。 删除 也 是 ,总共 

















, 计算 机 得 先 确定 要 插入 的 值 不 存在 于 其 中 一 一 因为 这 就 是 集合 :不 允许 重复 值 。 
































入 "figs"， 那么 就 需要 做 一 次 如 下 的 查找 。 


第 1 步 : 





检查 索引 0 有 没有 "figs"。 





不 错 的 ,毕竟 你 不 会 想 买 重复 的 东西 。 如 果 
"dates",， "elderberries"]， 然 后 想 插 
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"apples" "bananas" "cucumbers" "elderberries" 








没有 ， 不 过 说 不 定 其 他 索引 会 有 。 为 了 在 真正 插入 前 确保 它 不 存在 于 任何 索引 上 ， 我 们 继续 。 
第 2 步 : 检查 索引 1。 





"apples" "bananas" "cucumbers" "elderberries" 














第 3 步 : 检查 索引 2。 


"apples" "bananas" "cucumbers" 可 "elderberries" 


第 4 步 : 检查 索引 3。 








"apples" "bananas" "cucumbers" "elderberries" 


第 5 步 : 检查 索引 4。 








"apples" "bananas" "cucumbers" - "elderberries" 


到 最 后 一 步 。 








第 6 步 : 在 集合 末尾 插入 "figs"。 























在 集合 的 末尾 插入 也 属于 最 好 的 情况 , 不 过 对 于 一 个 含有 5 个 元 素 的 集合 , 你 仍然 要 花 6 步 。 
因为 ， 在 最 终 搬 入 的 那 一 步 之 前 ， 要 把 5 个 元 素 都 检查 一 遍 。 

换 名 话说， 在 N 个 元 素 的 集合 中 进行 插入 的 最 好 情况 需要 N+ 1 步 一 一 N 步 去 确认 被 插入 的 
值 不 在 集合 中 ， 加 上 最 后 搬入 的 1 步 。 

最 坏 的 情况 则 是 在 集合 的 开头 插入 ， 这 时 计算 机 得 检查 N 个 格子 以 保证 集合 不 包含 那个 值 ， 
然后 用 入 步 来 把 所 有 值 右 移 ， 最 后 再 用 1 步 来 插入 新 值 。 总 共 2N+ 1 步 。 

这 是 否 意味 着 因为 它 的 插入 比 一 般 的 数组 慢 , 所 以 就 不 要 用 了 呢 ? 当然 不 是 。 在 需要 保证 数 
据 不 重复 的 场景 中 ， 集 合 是 非常 重要 的 〈 真希 望 有 一 天 我 的 电话 本 能 恢复 正常 )。 但 如 果 没有 这 
种 需求 , 那么 选择 搬入 比 集合 快 的 数组 会 更 好 一 些 。 具 体 哪 种 数据 结构 更 合适 ， 当 然 要 根据 你 的 
实际 应 用 场景 而 定 。 







































































1.3 ”总结 


/AN 三 口 





理解 数据 结构 的 性 能 , 关键 在 于 分 析 操 作 所 需 的 步 数 。 采 取 哪 种 数据 结构 将 决定 你 的 程序 是 
能 够 承受 住 压力 , 还 是 骨 演 。 本 章 特 别 讲解 了 如 何 通 过 步 数 分 析 来 判断 某 种 应 用 该 选择 数组 还 是 
集合 。 

不 同 的 数据 结构 有 不 同 的 时 间 复 杂 度 , 类 似 地 , 不 同 的 算法 ( 即使 是 用 在 同一 种 数据 结构 上 ) 
也 有 不 同 的 时 间 复 杂 度 。 既 然 我 们 已 经 学 会 了 时 间 复 杂 度 的 分 析 方 法 , 那么 现在 就 可 以 用 它 来 对 
比 各 种 算法 ， 找 出 能 够 发 挥 代 码 极限 性 能 的 那个 。 这 正 是 下 一 章 所 要 讲 的 。 
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上 一 章 我 们 学 习 了 两 种 数据 结构 ， 并 明白 了 选择 合适 的 数据 结构 将 会 显著 地 提升 代码 的 性 
能 .即使 是 像 数 组 和 集合 这 样 相 似 的 两 种 数据 结构 , 在 高 负荷 的 运行 环境 下 也 会 表现 得 天 差 地 别 。 

在 本 章 ， 你 将 会 发 现 ， 就 算数 据 结构 确定 了 , 代码 的 速度 也 还 会 受 另 一 重要 因素 影响 ， 那 就 
是 算法 。 

算法 这 个 词 听 起 来 很 深奥 ， 其 实 不 然 。 它 只 是 解决 某 个 问题 的 一 套 流 程 。 准 备 一 碗 麦片 的 流 
程 也 可 以 说 是 一 种 算法 ， 它 包含 以 下 4 步 (对 我 来 说 是 4 步 吧 )。 

(1) 拿 个 硫 。 

(2) 把 麦片 倒 进 碗 里 。 

(3) 把 牛奶 倒 进 碗 里 。 

(4) 把 勺子 放 到 碗 里 。 


在 计算 机 的 世界 里 ， 算 法 则 是 指 某 项 操作 的 过 程 。 上 一 章 我 们 研究 了 4 种 主要 操作 , 包括 读 
取 、 查 找 、 搬 入 和 删除 。 这 一 章 我 们 还 是 会 经 常 提 到 它们 , 而 且 一 种 操作 可 能 会 有 不 止 一 种 做 法 。 
也 就 是 说 ， 一 种 操作 会 有 多 种 算法 的 实现 。 

我 们 很 快 会 看 到 不 同 的 算法 能 使 代码 变 快 或 者 变 慢 一 一 高 负载 时 甚至 慢 到 停止 工作 。 不 过 ， 
现在 先 来 认识 一 种 新 的 数据 结构 : 有 序数 组 。 它 的 查找 算法 就 不 止 一 种 ,我 们 将 会 学 习 如 何 选 出 
正确 的 那 种 。 







































































2.1 有 序数 组 


有 序数 组 跟 上 一 章 讨论 的 数组 几乎 一 样 , 唯一 区 别 就 是 有 序数 组 要 求 其 值 总 是 保持 有 序 ( 你 
猜 对 了 )。 即 每 次 搬入 新 值 时 ， 它 会 被 插入 到 适当 的 位 置 ， 使 整个 数组 的 值 仍 然 按 顺序 排列 。 常 
规 的 数组 则 并 不 考虑 是 否 有 序 ， 直 接 把 值 加 到 未 尾 也 没 问题 。 


以 数组 [3,17,89,202] 为 例 。 


























回国 加 本 


假设 这 是 个 常规 的 数组 ， 你 准备 将 75 插入 ， 那 就 可 以 把 它 放 到 尾 端 ， 如 下 所 示 
[le ll 
如 上 一 章 所 述 ， 





计算 机 只 要 1 步 就 能 完成 这 种 操作 。 

















但 如 果 这 是 一 个 有 序数 组 ， 你 就 必须 要 找到 一 个 适当 的 位 置 ， 使 插入 75 之 后 整个 数组 依然 
有 序 。 











做 起 来 可 不 像 说 的 那么 简单 。 整 个 过 程 不 可 能 一 步 完 成 , 因为 计算 机 需要 先 找 出 那个 适当 的 
位 置 ， 然 后 将 其 及 以 后 的 值 右 移 来 腾 出 空间 给 75。 下 面 就 来 介绍 分 解 的 步骤 。 
先 回顾 一 下 原始 的 数组 。 








澡 
江 
yy 
区 


因为 75 大 于 3， 所 以 75 应 该 在 它 右边 的 某 个 位 置 。 而 具体 的 位 置 
再 检查 下 一 个 格子 。 




















， 目 前 还 是 不 能 确定 ， 于 是 ， 
第 2 步 : 检查 下 一 格 的 值 。 
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因为 75 大 于 17， 所 以 继续 。 
第 3 步 : 检查 下 一 格 的 值 。 


回回 加 区 EE 


个 


这 次 是 80， 大 于 7$。 因 为 这 是 第 一 次 遇 到 大 于 75 的 值 ， 可 想 而 知 ， 必 须 把 75 放 在 80 的 左 侧 以 
使 整个 数组 维持 有 序 。 但 要 在 这 里 插入 75， 还 得 先 将 它 的 位 置 空 出 来 。 


第 4 步 : 将 最 后 一 个 值 右 移 。 
[el fw 
~ 
第 5 步 : 将 倒数 第 二 个 值 右 移 。 
oT Tal 
~ 
第 6 步 : 终于 可 以 把 75 插 入 到 正确 的 位 置 上 了 。 


EEE 
个 


可 以 看 到 , 往 有 序数 组 中 插入 新 值 , 需要 先 做 一 次 查找 以 确定 插入 的 位 置 。 这 是 它 跟 常规 数 
组 的 关键 区 别 ( 在 性 能 方面 ) 之 一 。 


虽然 搬入 的 性 能 比 不 上 和 常规 数组 ， 但 在 查找 方面 ， 有 序数 组 却 有 着 特殊 优势 。 


















































2.2 ”查找 有 序数 组 

上 一 章 介绍 了 常规 数组 的 查找 方式 : 从 左 至 右 ， 逐 个 格子 检查 ,直至 找到 。 这 种 方式 称 为 线 
性 查找 。 

接 下 来 看 看 有 序数 组 的 线性 查找 跟 常规 数组 有 何不 同 。 

设 一 个 常规 数组 [17,3,75,292,89] ， 如 果 想 在 里 面 查找 22 ( 其 实 并 不 存在 )， 那 你 就 得 逐 
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个 元 素 去 检查 ， 因 为 22 可 能 在 任何 一 个 位 置 上 。 要 想 在 到 达 未 尾 之 前 结束 检查 ， 那 么 所 找 的 值 
必须 在 末尾 之 前 出 现 。 

然而 对 于 有 序数 组 来 说 ， 即 便 它 不 包含 要 找 的 值 , 我们 也 可 以 提早 停止 查找 。 假 设 要 在 有 序 
数组 [3,17,75,80,202] 里 查找 22, 我 们 可 以 在 查 到 75 的 时 候 就 结束 , 因为 22 不 可 能 出 现在 75 
的 右边 。 

以 下 是 用 Ruby 语言 实现 的 有 序数 组 线性 查找 。 


def linear search(array, value) 














人 ## 遍历 数组 的 每 一 个 元 素 
array.each do |etement | 


玉 如 果 这 个 元 素 等 于 我 们 要 找 的 值 ， 则 将 其 返回 
if element == value 
return value 


玉 如 果 这 个 值 大 于 我 们 要 找 的 值 ， 则 提早 退出 循环 
elsif element > value 
break 
end 
end 


人 ## 如 果 没 找到 ， 则 返回 空 值 


return nil 
end 


因此 ， 有 序数 组 的 线性 查找 大 多 数 情况 下 都 会 快 于 常规 数组 。 除 非 要 找 的 值 是 最 后 那个 , 或 
者 比 最 后 的 值 还 大 ， 那 就 只 能 一 直 查 到 最 后 了 。 

只 看 到 这 里 的 话 ， 可 能 你 还 是 不 会 觉得 两 种 数组 在 性 能 上 有 什么 巨大 区 别 。 

这 是 因为 我 们 还 没 释放 算法 的 潜能 。 这 是 接 下 来 就 要 做 的 。 

至 今 我 们 提 到 的 查找 有 序数 组 的 方法 就 只 有 线性 查找 。 但 其 实 , 线性 查找 只 不 过 是 查找 算法 
的 其 中 一 种 而 已 。 这 种 逐个 格子 检查 直至 找到 为 止 的 过 程 ， 并 不 是 查找 的 唯一 途径 。 


有 序数 组 相 比 常规 数组 的 一 大 优势 就 是 它 可 以 使 用 另 一 种 查找 算法 。 此 种 算法 名 为 二 分 查 
找 ， 它 比 线性 查找 要 快 得 多 。 







































































2.3 ”二 分 查找 

你 小 时 候 或 许 玩 过 这 样 一 种 猜谜 游戏 (或 者 现在 跟 你 的 小 孩 玩 过 ); 我 心里 想 着 一 个 1 到 100 
之 间 的 数字 ， 在 你 猜 出 它 之 前 ， 我 会 提示 你 的 答案 应 该 大 一 点 还 是 小 一 点 。 

你 应 该 赁 直觉 就 知道 这 个 游戏 的 策略 。 一 开始 你 会 先 狂 处 于 中 间 的 50, 而 不 是 1。 为 什么 ? 
因为 不 管 我 接 下 来 告诉 你 更 大 或 是 更 小 ， 你 都 能 排除 掉 一 半 的 错误 答案 ! 












































2.3 二 分 查找 17 
如 果 你 说 50， 然 后 我 提示 要 再 大 一 点 ， 那 么 你 应 该 会 选 75， 以 排除 掉 剩余 数字 的 一 半 。 如 
果 在 75 之 后 我 告诉 你 要 小 一 点 , 你 就 会 选 62 或 63。 总 之 ,一 直 都 猜 中间 值 ， 就 能 不 断 地 缩小 一 
半 的 范围 。 
下 面 来 演示 这 个 过 程 ， 但 仅 以 1 到 10 为 例 。 | 
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这 就 是 二 分 查找 的 通俗 描述 。 


有 序数 组 相 比 常规 数组 的 一 大 优势 就 是 它 除了 可 以 用 线性 查找 , 还 可 以 用 二 分 查找 。 常 规 数 
组 因为 无 序 ， 所 以 不 可 能 运用 二 分 查找 。 












































为 了 看 出 它 的 实际 效果 ,假设 有 一 个 包含 9 个 元 素 的 有 序数 组 ,计算 机 不 知道 每 个 格子 的 值 ， 
如 下 图 所 示 。 
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然后 ， 用 二 分 查找 来 找 出 7， 过 程 如 下 。 


第 1 步 : 检查 正中 间 的 格子 。 因 为 数组 的 长 度 是 已 知 的 ， 将 长 度 除 以 2， 我 们 就 可 以 跳 到 确 
切 的 内 存 地 址 上 ， 然 后 检查 其 值 。 








值 为 9， 可 推测 出 7 应 该 在 其 左边 的 某 个 格子 里 。 而 且 ， 这 下 我 们 也 排除 了 一 半 的 格子 ， 即 9 右 
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边 的 那些 (以 及 9 本 身 )。 
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第 2 步 : 检查 9 左边 的 那些 格子 的 最 中 间 那 个 。 因 为 这 里 最 中 间 有 两 个 ,我 们 就 随便 挑 了 左 








?| 4| ?| ? 国 轩 国 国 重 
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它 的 值 为 4,， 那么 7 就 在 它 的 右边 了 。 由 此 4 左边 的 格子 也 就 排除 了 。 
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第 3 步 : 还 剩 两 个 格子 里 可 能 有 7。 我 们 随便 挑 个 左边 的 。 





a 6 | 7 Be 


1 


第 4 步 : 就 剩 一 个 了 。( 如 果 还 没有 ， 那 就 说 明 这 个 有 序数 组 里 真 的 没有 7。 ) 


?14|6 > el 


人 


终于 找到 7 了 ,总 共 4 步 。 是 的 ， 这 个 有 序数 组 要 是 用 线性 查找 也 会 是 4 步 ， 但 稍 后 你 就 会 
见识 到 二 分 查找 的 强大 。 


以 下 是 二 分 查找 的 Ruby 实现 。 


def binary search(array, value) 


























天 首先 ， 设 定 下 界 和 上 界 ， 以 限定 所 查 之 值 可 能 出 现 的 区 域 。 
人 # 在 开始 时 ， 以 数组 的 第 一 个 元 素 为 下 界 ， 以 最 后 一 个 元 素 为 上 界 


Lower bound = 0 
upper bound = array.Length - 1 


人 # 循环 检查 上 界 和 下 界 之 间 的 最 中 间 的 元 素 


2.4 二 分 查找 与 线性 查找 19 





while Lower bound <= upper_bound do 


# 如 此 找 出 最 中 间 的 格子 之 索引 
# (无 须 担 心 商 是 不 是 整数 ， 因 为 Ruby 总 是 把 两 个 整数 相 除 所 得 的 小 数 部 分 去 掉 ) 





midpoint = (upper bound + Lower bound) / 2 
# 获取 该 中 间 格 子 的 值 
value _ at midpoint = array[midpoint] 


# 如 果 该 值 正 是 我 们 想 查 的 ， 那 就 完事 了 。 
# 否则 ， 看 你 是 要 往 上 找 还 是 往 下 找 ， 来 调整 下 界 或 上 界 


if value < value at midpoint 
upper bound = midpoint - 1 

elsif value > value at midpoint 
lower bound = midpoint + 1 


elsif value == value at midpoint 
return midpoint 
end 
end 


# 当下 界 超越 上 界 ， 便 知 数组 里 并 没有 我 们 所 要 找 的 值 


return nil 
end 


2.4 二 分 查找 与 线性 查找 
对 于 长 度 太 小 的 有 序数 组 ， 二 分 查找 并 不 比 线性 查找 好 多 少 。 但 我 们 来 看 看 更 大 的 数组 。 
对 于 拥有 100 个 值 的 数组 来 说 ， 两 种 查找 需要 的 最 多 步 数 如 下 所 示 。 
口 线性 查找 : 100 步 
口 二 分 查找 : 7 步 
用 线性 查找 的 话 ， 如 果 要 找 的 值 在 最 后 一 个 格子 ,或 者 比 最 后 一 格 的 值 还 大 , 那么 就 得 查 遍 
每 个 格子 。 有 100 个 格子 ， 就 是 100 步 。 
二 分 查找 则 会 在 每 次 猜测 后 排除 掉 一 半 的 元 素 。100 个 格子 ,在 第 一 次 猜测 后 ， 便 排除 了 
50 个 。 
再 换个 角度 来 看 ， 你 就 会 发 现 一 个 规律 。 
长 度 为 3 的 有 序数 组 ， 二 分 查找 所 需 的 最 多 步 数 是 2。 
若 长 度 翻 倍 ， 变 成 7 ( 以 奇数 为 例会 方便 选择 正中 间 的 格子 ， 于 是 我 们 把 长 度 翻 倍 后 又 增加 
了 一 个 数 )， 则 最 多 步 数 会 是 3。 
若 再 翻 倍 (并 加 1 )， 变 成 15 个 元 素 ， 那 么 最 多 步 数 会 是 4。 
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规律 就 是 ， 每 次 有 序数 组 长 度 乘 以 2， 二 分 查找 所 需 的 最 多 步 数 只 会 加 1。 
这 真是 出 奇 地 高 效 。 


相反 ,在 3 个 元 素 的 数组 上 线性 查找 ， 最 多 要 3 步 ，7 个 元 素 就 最 多 要 7 步 ，100 个 元 素 就 
ee 100 步 ， 即 元 素 有 多 少 ， 最 多 步 数 就 是 多 少 。 数 组 长 度 翻 倍 ,线性 查找 的 最 多 步 数 就 会 翻 
倍 ， 而 二 分 查找 则 只 是 增加 1 步 。 


这 种 规律 可 以 用 下 图 来 展示 。 
































元 素数 量 


如 果 数 组 变 得 更 大 ， 比 如 说 10 000 个 元 素 ， 那 么 线性 查找 最 多 会 有 10 000 步 ， 而 二 分 查找 
最 多 只 有 14 步 。 再 增 大 到 1 000 000 个 元 素 ， 则 线性 查找 最 多 有 1 000 000 步 ， 二 分 查找 最 多 只 
有 20 步 。 


不 过 还 要 记 住 ， 有 序数 组 并 不 是 所 有 操作 都 比 常规 数组 要 快 。 如 你 所 见 , 它 的 搬入 就 相对 要 
慢 。 衡量 起 来 , 虽然 插入 是 慢 了 一 些 , 但 查找 却 快 了 许多 。 还 是 那 句 话 ， 你 得 根据 应 用 场景 来 判 
断 哪 种 更 合适 。 












































2.5 总结 

关于 算法 的 内 容 就 是 这 些 。 很 多 时 候 , 计算 一 样 东 西 并 不 只 有 一 种 方法 , 换 种 算法 可 能 会 极 
大 地 影响 程序 的 性 能 。 

同时 你 还 应 意识 到 , 世界 上 并 没有 哪 种 适用 于 所 有 场景 的 数据 结构 或 者 算法 。 你 不 能 因为 有 

序数 组 能 使 用 二 分 查找 就 永远 只 用 有 序数 组 。 在 经 常 插入 而 很 少 查 找 的 情况 下 ， 品 然 插入 迅 的 

常规 数组 会 是 更 好 的 选择 。 

如 之 前 所 述 ， 比 较 算 法 的 方式 就 是 比较 各 自 的 步 数 。 

下 一 章 , 我 们 将 会 学 习 如 何 规范 地 描述 数据 结构 和 算法 的 时 间 复 杂 度 。 有 了 这 种 通用 的 表达 
方式 ， 就 能 更 容易 地 观察 出 哪 种 算法 符合 我 们 的 实际 需求 。 














大 O 记 法 








从 之 前 的 章节 中 我 们 了 解 到 ， 影 响 算法 性 能 的 主要 因素 是 其 所 需 的 步 数 。 


然而 ,我 们 不 能 简单 地 把 一 个 算法 记 为 “22 步 算法 ”， 把 另 一 个 算法 记 为 “400 步 算 法 ”， 
为 一 个 算法 的 步 数 并 不 是 固定 的 。 以 线性 查找 为 例 , 它 的 步 数 等 于 数组 的 元 素数 量 。 如 果 数 组 有 
22 个 元 素 ， 线 性 查找 就 需要 22 步 ， 如果 数组 有 400 个 元 素 ， 线 性 查找 就 需要 400 步 。 

量化 线性 查找 效率 的 更 准确 的 方式 应 该 是 : 对 于 具有 NN 个 元 素 的 数组 , 线性 查找 最 多 需要 NN 
步 。 当 然 ， 这 上 听 起 来 很 咖 唆 。 

为 了 方便 表达 数据 结构 和 算法 的 时 间 复 杂 度 , 计算 机 科学 家 从 数学 界 借鉴 了 一 种 简洁 又 通用 
的 方式 ， 那 就 是 大 O 记 法 。 这 种 规范 化 语言 使 得 我 们 可 以 轻松 地 指出 一 个 算法 的 性 能 级 别 ， 也 令 
学 术 交 流 变 得 简单 。 
掌握 了 大 O 记 法 ， 就 掌握 了 算法 分 析 的 专业 工具 。 

虽说 大 O 记 法 源 于 数学 领域 ， 但 接 下 来 我 们 不 会 讲解 任何 数学 术语 ， 只 介绍 跟 计算 机 科学 
相关 的 部 分 。 并 且 , 我 们 会 循序 渐进 ， 先 用 简单 的 词汇 来 解释 它 ， 然 后 在 接 下 来 的 三 章 中 将 其 构 
建 完善 。 大 O 记 法 不 复杂 ， 但 我 们 还 是 分 成 了 几 个 章节 来 细 述 ， 使 其 更 容易 理解 。 




































































3.1 大 OO: 数 步 数 

为 了 统一 描述 ， 大 O 不 关注 算法 所 用 的 时 间 ， 只 关注 其 所 用 的 步 数 。 

第 1 章 介绍 过 ， 数 组 不 论 多 大 ， 读 取 都 只 需 1 步 。 用 大 O 记 法 来 表示 ， 就 是 : 

0(1) 

很 多 人 将 其 读 作 “大 01”,， 也 有 些 人 读 成 “1 数量 级 ”。 我 一 般 读 成 “01”。 虽然 大 O 记 法 有 
很 多 种 读 法 ， 但 写法 只 有 一 种 。 

OU) 意 味 着 一 种 算法 无 论 面 对 多 大 的 数据 量 ， 其 步 数 总 是 相同 的 。 就 像 无 论 数 组 有 多 大 , 读 
取 元 素 都 只 要 1 步 。 这 1 步 在 旧 机 器 上 也 许 要 花 20 分 钟 ， 而 用 现代 的 硬件 却 只 要 1 纳 秒 。 但 这 
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两 种 情况 下 ， 读 取 数 组 都 是 1 步 。 
其 他 也 属于 O(1) 的 操作 还 包括 数组 末尾 的 插入 与 删除 。 之 前 已 证 明 , 无 论 数组 有 多 大 , 这 两 
种 操作 都 只 需 1 步 ， 所 以 它们 的 效率 都 是 0(1)。 


下 面 研究 一 下 大 O 记 法 如 何 描述 线性 查找 的 效率 。 回 想 一 下 ， 线 性 查找 在 数组 上 要 逐个 检 
查 每 个 格子 。 在 最 坏 情况 下 , 线性 查找 所 需 的 步 数 等 于 格子 数 。 即 如 前 所 述 : 对 于 X 个 元 素 的 数 
组 ,线性 查找 需要 花 入 步 。 


用 大 O 记 法 来 表示 ， 即 为 : 
O(N) 
我 将 其 读 作 “ON 。 
若 用 大 O 记 法 来 描述 一 种 处 理 一 个 N 元 素 的 数组 需 花 入 步 的 算法 的 效率 ,很 简单 ， 就 是 O(N)。 
























































前 面 提 过 ， 本 书 要 采用 一 种 易于 理解 的 方式 来 讨论 大 O。 当 然 这 不 是 唯一 的 方式 ,如果 
你 去 上 传统 的 大 学 算法 课程 , 老师 很 可 能 从 数学 角度 来 介绍 大 O。 因为 大 O 本 就 是 一 个 数学 
概念 ， 所 以 人 们 经 常用 数学 词 江 介绍 它 ， 比 如 说 “大 O 记 法 可 用 来 描述 一 个 函数 的 增长 率 的 
上 限 ”， 或 者 “如 果 函 数 g(Co) 的 增长 速度 不 比 函 数 ftx) 快 ， 那 么 就 称 g 属 于 O(f)”。 大 家 数学 
背景 不 同 ， 所 以 这 些 说 法 可 能 对 你 有 意义 ， 也 可 能 没什么 帮助 。 有 了 这 本 书 ， 你 不 需要 了 解 
太 多 数学 知识 ， 就 可 以 理解 大 O。 

如 果 你 想 深 入 研究 大 0 背后 的 数学 理论 ,可 参考 Thomas H. Cormen、Charles E. Leiserson、 
RonaldL. Rivest 和 Clifford Stein 所 著 的 《算法 导论 》 里 面 有 完整 的 解析 。 此 外 ，Justin Abrahms 
在 他 的 文章 中 也 对 大 O 做 了 不 错 的 定义 ， 维 基 百 科 上 也 有 大 量 的 数学 解释 。 


3.2 ”常数 时 间 与 线性 时 间 


从 OW) 可 以 看 出 ， 大 O 记 法 不 只 是 用 固定 的 数字 ( 如 22 、440 ) 来 表示 算法 的 步 数 ， 而 是 
基于 要 处 理 的 数据 量 来 描述 算法 所 需 的 步 数 。 或 者 说 ， 大 O 解答 的 是 这 样 的 问题 : 当 数 据 增长 
了 时， 步 数 如 何 变化 ? 

O(NV) 算 法 所 需 的 步 数 等 于 数据 量 ， 意 思 是 当 数 组 增加 一 个 元 素 时 ，O(N) 算 法 就 要 增加 1 步 。 
而 0(1) 算 法 无 论 面 对 多 大 的 数组 ， 其 步 数 都 不 变 。 

下 图 展示 了 这 两 种 时 间 复 杂 度 。 
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从 图 中 可 以 看 出 ，O( 和 WV) 呈现 为 一 条 对 角 线 。 当 数据 增加 一 个 单位 时 ,算法 也 随 之 增加 一 步 。 
也 就 是 说 ,数据 越 多 ,算法 所 需 的 步 数 就 越 多 。O(N) 也 被 称 为 线性 时 间 。 

相 比 之 下 ，0O(1) 则 为 一 条 水 平 线 ， 因 为 不 管 数 据 量 是 多 少 ,算法 的 步 数 都 恒定 。 所 以 ，0(1) 
也 被 称 为 常数 时 间 。 

因为 大 0 主要 关注 的 是 数据 量变 动 时 算法 的 性 能 变化 ， 所 以 你 会 发 现 ， 即 使 一 个 算法 的 恒定 
步 数 不 是 1， 它 也 可 以 被 归 类 为 0(1)。 假设 有 个 算法 不 能 1 步 完 成 ， 而 要 花 3 步 ， 但 无 论 数据 量 
多 大 ， 它 都 需要 3 步 。 如 果 用 图 形 来 展示 ， 该 算法 应 该 是 这 样 : 
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元 素数 量 

因为 不 管 数据 量 怎样 变化 ， 算 法 的 步 数 都 恒定 ， 所 以 这 也 是 常数 时 间 ， 也 可 以 表示 为 0(1)。 
虽然 从 技术 上 来 说 它 需 要 3 步 而 不 是 1 步 , 但 大 0O 记 法 并 不 纠结 于 此 。 简 单 来 说 ，O(1) 就 是 用 来 
表示 所 有 数据 增长 但 步 数 不 变 的 算法 。 

如 果 说 只 要 步 数 恒定 ，3 步 的 算法 也 属于 0(1)， 那 么 恒 为 100 步 的 算法 也 属于 O(D)。 虽 然 
100 步 的 算法 在 效率 上 不 如 1 步 的 算法 ,但 如 果 它 的 步 数 是 恒定 的 ， 那么 它 还 是 比 O(N) 更 高 效 。 

为 什么 呢 ?” 如 图 所 示 。 
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元 素数 量 

对 于 元 素 量 少 于 100 的 数组 ，O(N) 算 法 的 步 数 会 少 于 100 步 的 0(1) 算 法 。 当 元 素 刚 好 为 100 
个 时 ， 两 者 的 步 数 同 为 100。 而 一 旦 超过 100 个 元 素 ， 注 意 ，O(N) 的 步 数 就 多 于 0(1)。 

因为 数据 量 从 这 个 临界 点 开始 ， 直 至 无 限 ，O(N) 都 会 比 O() 花 更 多 步 数 ， 所 以 总 体 上 来 说 ， 
O(N) 比 O(1) 低 效 。 

这 对 于 步 数 恒 为 1000 000 的 0(1) 算 法 来 说 也 是 一 样 的 。 当 数 据 量 一 直 增 长 时 ， 一 定 会 到 达 一 
个 临界 点 ， 使 得 O(N) 算 法 比 0(1) 算 法 低 效 ， 而 且 这 种 落后 的 状况 会 持续 到 数据 量 无 限 大 的 时 候 。 


3.3 同一 算法 ， 不 同 场景 

之 前 的 章节 我 们 提 到 ， 线 性 查找 并 不 总 是 O(N) 的 。 当 要 找 的 元 素 在 数组 末尾 ， 那 确实 是 O(N)。 
但 如 果 它 在 数组 开头 ，1 步 就 能 找到 的 话 ， 那 么 技术 上 来 说 应 该 是 0(1)。 所 以 概括 来 说 ,线性 查 
找 的 最 好 情况 是 0(1)， 最 坏 情况 是 O(N)。 

虽然 大 O 可 以 用 来 表示 给 定 算法 的 最 好 和 最 坏 的 情景 ， 但 若 无 特 别 说 明 ， 大 0 记 法 一 般 都 
是 指 最 坏 情况 。 因 此 尽管 线性 查找 有 0(1) 的 最 好 人 情况， 但 大 多 数 资料 还 是 把 它 归 类 为 O(N)。 
这 种 悲观 主义 其 实 是 很 有 用 的 : 知道 各 种 算法 会 差 到 什么 程度 ， 能 使 我 们 做 好 最 坏 打算 ， 以 
最 适合 的 算法 。 











选 出 


3.4 第 三 种 算法 

上 一 章 我 们 学 到 : 在 同一 个 有 序数 组 里 ,二 分 查找 比 线性 查找 要 快 。 下面 就 来 看 看 如 何 用 大 
O 记 法 描述 二 分 查找 。 

它 不 能 写成 0(1)， 因 为 二 分 查找 的 步 数 会 随 着 数据 量 的 增长 而 增长 。 它 也 不 能 写成 OOV)， 
因为 步 数 比 元 素数 量 要 少 得 多 , 正如 之 前 我 们 看 到 的 , 包含 100 个 元 素 的 数组 只 要 7 步 就 能 找 完 。 

看 来 ， 二 分 查找 的 时 间 复 杂 度 介 于 0(1) 和 O( 和 W) 之 间 。 
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好 了 ， 二 分 查找 的 大 O 记 法 是 : 

O(log N) 
我 将 其 读 作 “0O log N”。 归 于 此 类 的 算法 ,它们 的 时 间 复 杂 度 都 叫 作对 数 时 间 。 

简单 来 说 ，O(log 入 ) 意 味 着 该 算法 当 数 据 量 翻 倍 时 ， 步 数 加 1。 这 确实 符合 之 前 章节 我 们 
所 介绍 的 二 分 查找 。 下 面 我 们 先 整理 一 下 至 今 学 到 的 东西 ， 之 后 马上 就 解释 采取 这 种 记 法 的 

到 这 里 我 们 所 提 过 的 3 种 时 间 复 杂 度 ， 按 照 效 率 由 高 到 低 来 排序 的 话 ， 会 是 这 样 : 

O() 

O(log N) 

O(N) 

下 图 为 它们 三 者 的 对 比 。 

注意 O(log 入 ) 曲 线 的 微 字 ， 使 其 效率 略 差 于 O(1)， 却 远 胜 于 O(N)。 
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步 数 































































































O(log N) 
































| bh TO) 
元 素数 量 
若 想 理解 这 种 时 间 复 杂 度 为 什么 是 Oodog N)， 我们 得 先 学 习 一 下 对 数 。 如 果 你 对 这 个 数学 概 
念 已 经 很 熟悉 了 ， 那 么 可 以 跳 过 下 一 节 。 





3.5 ”对 数 

让 我 们 来 研究 下 为 什么 二 分 查找 之 类 的 算法 被 记 为 O(log N)， 到 底 log 是 什么 ? 

log 即 是 对 数 ( logarithm )。 注意 , 虽然 它 的 英文 看 起 来 和 读 起 来 都 跟 算法 (algorithm ) 很 像 ， 
但 它 与 算法 无 关 。 

对 数 是 指数 的 反 函 数 ， 所 以 我 们 先 回顾 一 下 指数 。 
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2 等 于 : 
2x2x2 
结果 为 8。 


log 8 则 将 上 述 计算 反 过 来 ， 它 意思 是 : 要 把 2 乘 以 自身 多 少 次 ， 才 能 得 到 8。 因 为 需要 3 
次 ， 所 以 ，log2 8 = 3。 


再 来 一 个 例子 。 
2 可 以 解释 为 : 
2x2x2x2x2x2=64 

因为 2 要 乘 以 自身 6 次 才 得 到 64， 所 以 ，log, 64 = 6。 

不 过 以 上 都 是 教科 书 式 的 定义 ， 我 打算 换 一 种 更 形象 和 更 易于 理解 的 方式 来 解释 。 
logs 8 可 以 表达 为 : 将 8 不 断 地 除 以 2 直到 1， 需 要 多 少 个 2。 
8/21212=1( 注 : 按照 从 左 到 右 的 顺序 计算 。) 

或 者 说 ,将 8 不断 地 除 以 2， 要 除 多 少 次 才能 到 1 呢 ? 答案 是 3， 所 以 ，log8 = 3。 
类 似 地 ，log; 64 可 以 解释 为 : 将 64 除 以 2 多少 次 ， 才 能 得 到 1。 
64/2/12/2/12/212=1 

因为 这 里 有 6 个 2， 所 以 ，log; 64 = 6。 
现在 你 应 该 明白 对 数 是 怎么 回 事 了 ， 那 么 O(log N) 就 很 好 懂 了。 



































3.6 解释 O(log N) 

现在 回 到 大 O 记 法 。 当 我 们 说 O(log 入 时， 其实 指 的 是 O(log M)， 不 过 为 了 方便 就 省 略 了 2 
而 已 。 

你 应 该 还 记得 O(N) 代 表 算 法 处 理 NW 个 元 素 需 要 NW 步 。 如 果 元 素 有 8 个， 那么 这 种 算法 就 需 
要 8 步 。 

O(log M) 则 代表 算法 处 理 N 个 元 素 需 要 log N 步 。 如 果 有 8 个 元 素 , 那么 这 种 算法 需要 3 步 ， 
因为 logs 8 = 3。 

从 另 一 个 角度 来 看 ， 如 果 要 把 8 个 元 素 不 断 地 分 成 两 半 , 那么 得 拆 分 3 次 才能 拆 到 只 剩 1 个 
元 素 。 

这 正 是 二 分 查找 所 干 的 事情 。 它 就 是 不 断 地 将 数组 拆 成 两 半 ， 直至 范围 缩小 到 只 剩 你 要 找 的 
那个 元 素 。 
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简单 来 说 ，O(log N) 算 法 的 步 数 等 于 二 分 数据 直至 元 素 剩余 1 个 的 次 数 。 
下 表 是 OO 和 O(log N) 的 效率 对 比 。 











NN 个 元 素 O(N) O(log N) 
8 8 3 
16 16 4 
32 32 5 
64 64 6 
128 128 7 
256 256 8 
512 512 9 
1024 1024 10 


每 次 数据 量 翻 倍 时 ，O(N) 算 法 的 步 数 也 跟着 翻 倍 ，O(log 入) 算法 却 只 需 加 1。 
后 面 的 章节 我 们 还 会 学 到 除了 这 3 种 时 间 复 杂 度 以 外 的 算法 。 不 过 现在 , 我 们 还 是 先 把 已 经 
学 会 的 实践 到 日 常 的 代码 中 。 














3.7 ”实例 
以 下 是 打印 列表 所 有 元 素 的 典型 Python 代码 。 


things = ['apples', 'baboons', 'cribs', 'dulcimers'] 

















for thing in things: 
print "Here's a thing: %s" % thing 


它 的 效率 要 怎么 用 大 O 记 法 来 表示 呢 ? 
首先 ， 这 是 一 个 算法 的 例子 。 虽 然 它 并 没有 多 人 么 厉害 ,但 不 管 一 段 代 码 做 什么 事情 ， 技 术 上 
来 说 它 都 是 一 个 算法 一 一 因为 它 是 解决 某 种 问题 的 一 个 独特 的 过 程 。 在 此 例 中 , 问题 是 打印 列表 
的 所 有 元 素 ， 而 算法 是 在 for 循环 中 使 用 print。 
为 了 得 出 它 的 大 O 记 法 , 我 们 需要 分 析 这 个 算法 的 步 数 。 这 段 代码 的 主要 部 分 一 一 for 循环 
会 走 4 步 ， 因 为 列表 总 共有 4 个 元 素 。 


然而 ， 此 过 程 不 一 定 总 是 这 样 。 如 果 列 表 有 10 个 元 素 , 那么 for 循环 就 会 是 10 步 。 因 为 这 
里 for 的 步 数 等 于 元 素数 量 ， 所 以 整个 算法 的 效率 是 O(N)。 


再 来 一 个 例子 ， 这 是 大 家 都 知道 的 最 基础 的 代码 。 


print 'Hello world!’' 
它 永 远 都 只 会 是 1 步 ， 所 以 是 0(1)。 
以 下 的 例子 是 代码 判断 一 个 数字 是 否 为 质数 。 
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def is prime(number): 
for i in range(2, number): 
if number % i == 0: 
return False 
return True 


它 接受 一 个 参数 ,名 为 number ,然后 用 一 个 for 循环 来 测试 number 除 以 2 到 number 之 间 的 数 ， 
看 是 否 有 余数 。 如 果 没 有 ， 则 number 非 质 数 ， 可 以 马上 返回 False。 但 如 果 一 直 测 到 number 
除 以 number 的 前 一 个 数 都 有 余数 ， 那 么 它 就 是 一 个 质数 ， 最 后 会 返回 True。 

此 算法 的 效率 为 O(N)。 它 不 以 数组 为 参数 ， 而 是 用 一 个 数字 。 如 果 is_prime 传人 的 是 7， 
那么 for 循环 就 要 差不多 走 7 次 ( 准确 来 说 是 5 步 ， 因 为 是 从 2 开始， 直到 该 数字 的 前 一 个 数 )。 
如 果 是 101， 那 就 循环 差不多 101 次 。 因 为 步 数 与 参数 的 大 小 一 致 ， 所 以 它 的 效率 是 O(N)。 









































学 会 大 0 记 法 , 我们 在 比较 算法 时 就 有 了 一 致 的 参考 系 。 有 了 它 , 我 们 就 可 以 在 现实 场景 中 
测量 各 种 数据 结构 和 算法 ， 写 出 更 快 的 代码 ， 更 轻松 地 应 对 高 负荷 的 环境 。 
下 一 章 会 用 一 个 实际 的 例子 ， 让 你 看 到 大 0 记 法 如 何 帮助 我 们 显著 地 提高 代码 的 性 能 。 


第 4 章 


运用 大 O 来 给 代码 提速 























大 O 记 法 能 客观 地 衡量 各 种 算法 的 时 间 复 杂 度 ， 是 比较 算法 的 利器 。 我 们 也 试 过 用 它 来 对 比 
二 分 查找 和 线性 查找 的 步 数 差异 ， 发 现 二 分 查找 的 步 数 为 O(log N)， 比 线性 查找 的 O(N) 快 得 多 。 

然而 , 写 代 码 的 时 候 并 不 总 有 这 样 明确 的 二 选 一 , 更 多 时 候 你 可 能 就 直接 采用 首先 想到 的 那 
种 算法 了 。 不 过 有 了 大 0 的话， 你 就 可 以 与 其 他 常用 的 算法 比较 ， 然 后 问 自己 :“ 我 的 算法 跟 它 
们 相 比 ， 是 快 还 是 慢 ? ” 


如 果 你 通过 大 O 发 现 自己 的 算法 比 其 他 的 要 慢 ， 你 就 应 该 退 一 步 ， 好 好 想 想 怎样 优化 它 ， 
才能 使 它 变 成 更 快 的 那 种 大 O。 虽 然 并 不 总 有 提升 空间 ， 但 在 确定 编码 之 前 多 加 考虑 还 是 好 的 。 

本 章 我 们 会 写 些 代码 来 解决 一 个 实际 问题 , 并 且 会 用 大 0 来 测量 算法 的 性 能 , 然后 看 看 是 否 
能 对 算法 做 些 修改 ,使 得 性 能 提升 。( 剧 透 : 能 。) 





















































4.1 冒 泡 排序 

但 在 讨论 实际 问题 之 前 ， 先 来 学 习 一 种 新 的 时 间 复 杂 度 。 我 们 会 从 计算 机 科学 的 经 典 算法 之 
一 开始 前 述 。 

排序 算法 是 计算 机 科学 中 被 广泛 研究 的 一 个 课题 。 历 时 多 年 , 它 发 展 出 了 数 十 种 算法 ,这些 
算法 都 着 眼 于 一 个 问题 ; 

如 何 将 一 个 无 序 的 数字 数组 整理 成 升序 ? 

你 会 在 本 章 以 及 下 一 章 看 到 这 些 算法 。 起 初 我 们 会 学 习 一 些 “ 简 单 排序 ”， 它 们 很 好 懂 ， 但 
效率 不 如 其 他 排序 算法 。 


冒 泡 排序 是 一 种 很 基本 的 排序 算法 ， 步 又 如 下 。 
(1) 指向 数组 中 两 个 相 邻 的 元 素 〈 最 开始 是 数组 的 头 两 个 元 素 )， 比 较 它 们 的 大 小 。 
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(2) 如 果 它 们 的 顺序 错 了 ( 即 左 边 的 值 大 于 右边 )， 就 互 换 位 置 。 
3 
135 
入 - 


1|2|31|5 



































如 果 顺 序 已 经 是 正确 的 ， 那 这 一 步 就 什么 都 不 用 做 。 


(3) 将 两 个 指针 右 移 一 格 。 























重复 第 (1) 步 和 第 (2) 步 ， 直 至 指针 到 达 数 绢 
(4) 重 复 第 (1) 至 (3) 步 ， 直 至 从 头 到 尾 都 无 须 且 


1|12|315 
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N\ 























日 未 尾 oO 
做 交换 ， 这 时 数组 就 排 好 序 了 


这 里 被 重复 的 第 (1) 至 (3) 步 是 一 个 轮回 ,也 就 是 说 ， 这 个 算法 的 主要 步骤 被 “轮回 ”执行 ， 





直到 整个 数组 的 顺序 正确 。 


4.2 冒 泡 排序 实战 




















下 面 来 举 一 个 完整 的 例子 。 假 设 要 对 [4，2，7，1，3] 进行 排序 。 它 现在 是 无 序 的 ， 我 们 的 
目标 是 产生 一 个 包含 相同 元 素 、 升 序 的 数组 。 











开始 第 1 次 轮回 。 
数组 一 开始 如 下 图 所 示 。 








第 1 步 : 首先 ， 比 较 4 和 2。 如 图 可 


第 2 步 : 交换 它们 的 位 置 。 





4|12 


7|113 





可 见 它 介 


] 的 顺序 是 错 的 。 
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第 3 步 : 比较 4 和 7。 
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它们 的 顺序 正确 ， 所 以 不 用 做 什么 交换 。 
第 4 步 : 比较 7 和 1。 
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第 6 步 : 比较 7 和 3。 
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第 7 步 : 顺序 错误 ， 于 是 进行 交换 。 
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214[1|317| 
因为 我 们 一 直 把 较 大 的 元 素 换 到 右边 , 所 以 现在 最 右 侧 的 7 正 处 于 其 正确 位 置 上 。 我 将 那个 格子 
用 虚线 圈 起 来 了 。 

这 也 正 是 此 种 算法 名 为 冒 泡 排序 的 原因 : 每 一 次 轮回 过 后 ， 未 排序 的 值 中 最 大 的 那个 都 会 
“ 冒 ” 到 正确 的 位 置 上 。 

因为 刚才 那 次 轮回 做 了 不 止 一 次 的 交换 ， 所 以 得 继续 轮回 。 
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下 面 来 第 2 次 轮回 。 
此 时 7 已 经 在 正确 的 位 置 上 了 。 
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第 8 步 : 从 比较 2 和 4 开始 。 


NE 
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1 AN 
它们 已 经 按 顺序 排 好 了 ， 所 以 直接 进行 下 一 步 。 


第 9 步 : 比较 4 和 1。 
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第 10 步 : 它们 的 顺序 错误 ， 于 是 交换 。 
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2 3 7 
2 13 
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第 11 步 : 比较 4 和 3。 
21114|1317| 
A NN 
第 12 步 : 顺序 错误 ， 进 行 交换 。 
Ce 
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[211131417| 
因为 7 已 经 在 上 一 次 轮回 里 排 好 了 ， 所 以 无 须 比 较 4 和 7。 此 外 ，4 移 到 了 正确 的 位 置 ， 本 次 轮 
回 结束 。 因 为 这 次 轮回 也 做 了 不 止 一 次 的 交换 ， 所 以 得 继续 轮回 。 
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下 面 来 第 3 次 轮回 。 
第 13 步 : 比较 2 和 1。 




















第 14 步 : 顺序 错误 ， 进 行 交 换 。 


























第 15 步 : 比较 2 和 3。 
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顺序 正确 ， 不 用 交换 。 
这 时 3 也 “ 冒 ”到 其 正确 位 置 了 。 因 为 这 次 轮回 做 了 不 止 一 次 的 交换 ， 所 以 还 要 继续 。 








于 是 开始 第 4 次 轮回 。 
第 16 步 : 比较 1 和 2。 





My 
A N 


顺序 正确 ， 不 用 交换 。 而 且 剩 下 的 元 素 也 都 排 好 序 了 ， 轮 回 结束 。 
因为 刚才 的 轮回 没有 任何 交换 ， 可 知 整个 数组 都 已 排 好 序 。 


ALL vv 
TEST 























4.3 冒 泡 排序 的 实现 
以 下 是 用 Python 写 的 冒 泡 排序 。 
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def bubble sort(List) : 
unsorted until index = Len(List) - 1 
sorted = False 


while not sorted: 
sorted = True 
for i in range(unsorted until index): 
if list[i] > list[i+1]: 
sorted = False 
list[i], list[i+1] = list[i+1], list[i] 
unsorted until index = unsorted until index - 1 


list = [65, 55, 45, 35, 25, 15, 10] 
bubble sort(list) 
print list 


让 我 们 来 一 行 行 地 分 析 。 我 会 先 摘出 代码 片段 ， 然 后 给 出 解释 。 

unsorted until index = len(list) - 1 

变量 unsorted until index 表示 “该 索引 之 前 的 数据 都 没 排 过 序 ”。 一 开始 整个 数组 都 是 
没 排 过 序 的 ， 所 以 此 变量 赋值 为 数组 的 最 后 一 个 索引 。 

sorted = False 

另外 还 有 一 个 sorted 变量 ,被 用 来 记录 数组 是 否 已 完全 排 好 序 。 当 然 一 开始 它 应 该 是 


FaLse。 











while not sorted: 
sorted = True 


接着 是 一 个 while 循环 ， 除 非 数 组 排 好 了 序 ， 不 然 它 不 会 停 下 来 。 然 后 ， 我 们 先 将 sorted 
初步 设置 为 True。 当 发 后 任何 交换 时 ， 我 们 会 将 其 改 为 FaLse。 如 果 在 一 次 轮回 里 没有 做 过 交 
换 ， 那 么 sorted 就 确定 为 True， 我 们 知道 数组 已 排 好 序 了 。 


for i in range(unsorted until index) : 
if list[i] > list[i+1]: 
sorted = False 
list[i], list[i+1] = list[i+1], list[i] 


在 while 循环 里 ， 还 有 一 个 for 循环 会 迭代 未 排序 元 素 的 索引 值 。 此 循环 中 ， 我 们 会 比较 
相 邻 的 元 素 ， 如 果 有 顺序 错误 ， 就 会 进行 交换 ， 并 将 sorted 改 为 False。 

unsorted until index = unsorted until index - 1 

到 了 这 一 行 , 就 意味 着 一 次 轮回 结束 了 ,同时 该 次 轮回 中 冒 泡 到 右 侧 的 值 处 于 正确 位 置 。 
为 unsorted_until_index 所 指 的 位 置 已 放 上 了 正确 的 元 素 , 所 以 减 1, 以 便 下 一 次 轮回 能 略 过 
该 位 置 。 

一 次 while 循环 就 是 一 次 轮回 ， 循 环 会 持续 直至 sorted 确定 为 True。 
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4.4 冒 泡 排 序 的 效率 


冒 泡 排 序 的 执行 步骤 可 分 为 两 种 。 


口 比较 : 比较 两 个 数 看 哪个 更 大 。 
口 交换 : 交换 两 个 数 的 位 置 以 使 它们 按 顺序 排列 。 


先 看 看 冒 泡 排序 要 进行 多 少 次 比较 。 
回顾 之 前 那个 5 个 元 素 的 数组 ， 你 会 发 现在 第 1 次 轮回 我 们 为 4 对 元 素 进 行 了 4 次 比较 。 
到 了 第 2 次 轮回 , 则 只 做 了 3 次 比较 ,这 是 因为 第 1 次 轮回 已 经 确定 了 最 后 一 个 格子 的 元 素 ， 4 
所 以 不 用 再 比较 最 后 两 个 元 素 了 。 
第 3 次 轮回 ， 只 比较 2 次 ; 第 4 次 ， 只 比较 1 次 。 
算 起 来 就 是 : 
4+3+2+1=10 次 比较 。 
推广 到 X 个 元 素 ， 需 要 
(CV-D+(V-2)+(V-3)+…+1 次 比较 。 
分 析 过 比较 之 后 ， 再 来 看 看 交换 。 
如 果 数 组 不 只 是 随机 打 乱 ， 而 是 完全 反 序 ,在 这 种 最 坏 的 情况 下 , 每 次 比较 过 后 都 得 进行 一 
次 交换 。 因 此 10 次 比较 加 10 次 交换 ， 总 共 20 步 。 
现在 把 两 种 步 又 放 在 一 起 来 看 。 一 个 含有 10 个 元 素 的 数组 ， 需 要 : 
9+8+7+6+5+4+3+2+1=45 次 比较 ， 以 及 45 次 交换 ， 共 90 步 。 
20 个 元 素 的 话 ， 就 是 : 
19+18+17+16+15+14+13+12+11+10+9+8+7+6+5+4+3+2+1=190 次 比较 ， 
以 及 190 次 交换 ， 共 380 步 。 
效率 太 低 了 。 元 素 量 呈 倍 数 增长 ， 步 数 却 呈 指数 增长 ， 如 下 表 所 示 。 

































































人 个 元 素 最 多 步 数 
5 20 
10 90 
20 380 
40 1560 
80 6320 


再 看 仔细 一 点 ， 你 会 发 现 随 着 的 增长 ， 步 数 大 约 增长 为 N 。 








N 个 元 素 最 多 步 数 N? 
5 20 25 

10 90 100 

20 380 400 
40 1560 1600 
80 6320 6400 


因此 描述 冒 泡 排序 效率 的 大 0O 记 法 ， 是 O(N”)。 
规范 一 些 来 说 : 用 O(N”) 算 法 处 理 入 个 元 素 ， 大 约 需 要 和? 步 。 








OW ) 算 法 是 比较 低 效 的 ， 随 着 数据 量变 多 ， 其 步 数 也 剧 增 ， 如 下 图 所 示 。 











O(N’) 











步 数 


CUV 

































































注意 OW ) 代 表 步 数 的 曲线 非常 陡 ! 
最 后 一 点 : O(N ) 也 被 叫 作 二 次 时 间 。 


4.5 二 次 问题 


假设 你 正在 写 一 个 JavaScript 应 用 ， 它 要 检查 数组 中 是 否 有 重复 值 。 
首先 想到 的 做 法 可 能 是 类 似 下 面 的 扔 套 for 循环 。 


function hasDuplicateValue(array) { 
for(var i = 0; i < array.length; i++) { 

for(var j = 0; j < array.length; j++) { 

if(i !== j &S& array[i] 


return true 
} 
} 
} 


return false; 








array[j]) 1{ 


元 素数 量 
肖 ， O(N) 的 则 只 呈 对 角 线 状 。 
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此 函数 用 var i 来 遍历 数组 元 素 。 每 当 i 指向 下 一 元 素 时 ,我 们 又 发 起 第 二 个 for 循环 ， 
用 var j 来 遍历 数组 元 素 ， 并 在 这 第 二 个 循环 过 程 中 检查 i 和 j 两 个 位 置 的 值 是 否 相 同 。 若 相 
同 ， 则 表示 数组 有 重复 值 。 如 果 两 层 循环 都 没 遇 到 重复 值 ， 则 最 终 返 回 false， 以 示 数 组 没有 重 
复 值 。 


虽然 可 以 这 么 做 ,但 它 的 效率 高 吗 ” 既然 我 们 学 过 一 点 大 0 记 法 ,那么 就 试 试用 大 O 来 评 
价 一 下 这 个 函数 吧 。 

记 住 , 大 0 测量 的 是 步 数 与 数据 量 的 关系 。 因此 , 我 们 要 测 的 就 是 : 给 hasDuplicateValue 
函数 传人 一 个 含有 N 个 元 素 的 数组 ， 最 坏 情况 下 需要 多 少 步 才能 完成 。 

要 回答 这 个 问题 ， 得 先 搞 清楚 这 个 函数 有 哪些 步骤 ， 以 及 其 最 坏 情况 是 什么 。 

该 函数 只 有 一 种 步骤 ,就 是 比较 。 它 重复 地 比较 i 和 j 所 指 的 值 ， 看 它们 是 否 相 等 ， 以 判断 
数组 有 没有 重复 值 。 最 坏 的 情况 就 是 没有 重复 ， 这 将 使 我 们 跑 遍 内 外 两 层 循环 ， 比 较 完 所 有 i、 
j 组 合 ， 才 返回 false。 

由 此 可 知 Y 个 元 素 要 比较 X 次 。 因 为 外 层 循 环 需要 N 步 来 遍历 数组 ， 而 这 里 的 每 1 步 ， 又 
会 发 起 内 层 循 环 去 用 N 步 遍历 数组 。 所 以 W 步 乘 以 N 步 等 于 NM 步 ， 此 函数 为 一 个 O(N”) 算 法 。 


想 要 证 明 的 话 ， 还 可 以 往 函 数 里 添加 一 些 跟踪 步 数 的 代码 。 


function hasDuplicateValue(array) { 
var steps = 0; 
for(var i = 0; i < array.length; i++) { 
for(var j = 0; j < array.length; j++) { 
steps++; 
if(i !== j && array[i] == array[j]) { 
return true; 
























































} 
下 
} 
console.log(steps); 
return false; 
} 
执行 hasDuplicateValue([1,2,3]) 的 话 ,， 你 会 看 到 Javascript console 输出 9， 表示 9 次 比 


较 。3 个 元 素 需 要 9 次 比较 ， 这 个 函数 是 O(N”) 的 经 典 例子 。 
毫 无 疑问 , 幅 套 循环 算法 的 效率 就 是 O(N”), 一 旦 看 到 山 套 循环 ,你 就 应 该 马上 想到 O(N”)。 
虽然 hasDuplicateValue 是 我 们 目前 唯一 想到 的 解决 方法 ,但 在 确定 采用 之 前 ， 应 意识 到 
它 的 OW 意味 着 低 效 。 当 遇 到 低 效 的 算法 时 ， 我 们 都 应 该 花 些 时 间 思 考 下 有 没有 更 快 的 做 法 。 
特别 是 当 数据 量 巨大 的 时 候 , 优化 不 足 的 应 用 甚至 可 能 会 突然 挂 掉 。 尽 管 这 可 能 已 经 是 最 佳 方案 ， 
但 你 还 是 要 确认 一 下 。 
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4.6 线性 解决 


以 下 是 hasDuplicateValue 的 另 一 种 实现 ， 它 没有 舱 套 循环 。 看 看 它 是 否 会 比 之 前 的 更 加 





























function hasDuplicateValue(array) { 
var existingNumbers = []; 
for(var i = 0; i < array.length; i++) { 
if(existingNumbers[array[i]] === undefined) { 
existingNumbers[array[i]] = 1; 
} elsef{ 
return true; 
} 
下 


return false; 


} 

此 实现 只 有 一 个 循环 ， 并 将 迭代 过 程 中 遇 到 的 数字 用 数组 existingNumbers 记录 下 来 。 其 
记录 方法 很 有 趣 : 每 发 现 一 个 新 的 数字 ， 就 以 其 为 索引 找 出 existingNumbers 中 对 应 的 格子 ， 
将 其 赋值 为 1。 

举 个 例子 ， 如 果 参 数 array 为 [3,5,8] ， 那 么 循环 结束 时 ，existingNumbers 就 会 变 成 以 
下 这 样 。 

[undefined, undefined, undefined, 1, undefined, 1, undefined, undefined, 1] 

里 面 那些 1 的 位 置 为 案 引 3、5、8， 因 为 array 包含 的 这 些 数字 已 被 发 现 。 

不 过 ,在 将 1 赋值 到 对 应 的 索引 上 之 前 ， 还 得 先 检查 索引 上 是 否 已 有 1。 如 果 有 ， 那 就 意味 
着 这 个 数字 曾经 遇 到 过 ， 也 就 是 传人 的 数组 有 重复 值 。 

为 了 确定 这 一 新 算法 的 时 间 复 杂 度 符合 哪 种 大 O, 我 们 得 考察 其 最 坏 情况 下 需要 多 少 步 。 与 
上 一 算法 类 似 ， 此 算法 的 主要 步骤 也 是 比较 。 读 取 existingNumbers 上 某 索 引 的 值 ， 并 与 
undefined 比较 ， 代 码 如 下 。 

if(existingNumbers[array[i]] === undefined) 

(其实 除了 比较 , 我 们 还 要 对 existingNumbers 进行 插入 , 但 这 无 关 紧 要 , 原因 会 在 下 一 章 
进行 讲解 。) 

同样 ， 最 坏 的 情况 就 是 无 重复 ， 因 为 你 得 跑 完整 个 循环 才能 发 现 。 

可 见 个 元 素 就 要 N 次 比较 。 因 为 这 里 只 有 一 个 循环 ， 数 组 有 多 少 个 元 素 ， 它 就 要 迭代 多 
少 次 。 要 证 明 这 个 猜想 ， 可 以 用 JavaScript console 来 打印 步 数 。 


function hasDuplicateValue(array) { 
var steps = 0; 
var existingNumbers = []; 
for(var i = 0; i < array.length; i++) { 






































steps++; 
if(existingNumbers[array[i]] === undefined) { 
existingNumbers[array[il]] = 1; 
} elLse { 
return true; 
} 
} 
console.log(steps); 
return false; 


} 
执行 hasDuplicateValue([1,2,3]) 的 话 ， 你 会 看 到 输出 为 3， 跟 元 素 个 数 一 致 。 


此 其 大 O 记 法 是 O(N)。 区 


我 们 知道 O(N) 远 远 快 于 O(N”)， 所 以 采用 第 二 种 算法 能 极 大 地 提升 hasDuplicateValue 的 
效率 。 如 果 这 个 程序 处 理 的 数据 量 很 大 ， 那 么 性 能 差别 是 很 明显 的 ( 其 实 第 二 种 算法 有 一 个 缺点 ， 
不 过 我 们 在 最 后 一 章 才 会 讲 到 )。 





























4.7 总 结 

毫 无 疑问 ,熟悉 大 O 记 法 能 使 我 们 发 现 低 效 的 代码 ， 有 助 于 我 们 挑选 出 更 快 的 算法 。 然 而 ， 
偶尔 也 会 有 两 种 算法 的 大 O 相同 , 但 实际 上 二 者 快慢 不 一 的 情况 。 下 一 童 我 们 就 来 学 习 当 大 O 记 
法 太 过 粗略 的 时 候 ， 如 何 识别 两 种 算法 的 效率 高 低 。 


用 或 不 用 大 O 来 优化 代码 























大 O 是 一 种 能 够 比较 算法 效率 ， 并 告诉 我 们 在 特定 环境 下 应 采用 何 种 算法 的 伟大 工具 。 但 
我 们 不 能 完全 依赖 于 它 。 因 为 有 时 候 即使 两 种 算法 的 大 O 记 法 完全 一 样 ， 但 实际 上 其 中 一 个 比 
男 一 个 要 快 得 多 。 

本 章 我 们 就 来 学 习 如 何 分 辨 那些 效率 貌似 一 样 的 算法 ， 从 而 选 出 较 快 的 那个 。 


5.1 选择 排序 

上 一 章 分 析 了 冒 泡 排 序 算法 ， 其 效率 是 O(N”)。 现 在 我 们 再 来 探索 另 一 种 排序 算法 ， 选 择 排 
序 ， 并 将 它 跟 冒 泡 排 序 对比 一 下 。 

选择 排序 的 步骤 如 下 。 

(1) 从 左 至 右 检查 数组 的 每 个 格子 ， 找 出 值 最 小 的 那个 。 在 此 过 程 中 ， 我 们 会 用 一 个 变量 3 
记 住 检查 过 的 数字 的 最 小 值 (事实 上 记 住 的 是 索引 , 但 为 了 看 起 来 方便 ， 下 图 就 直接 写 出 数值 )。 
如 果 一 个 格子 中 的 数字 比 记录 的 最 小 值 还 要 小 ， 就 把 变量 改 成 该 格子 的 索引 ， 如 图 所 示 。 

至 今 最 小 值 为 2 至 今 最 小 值 仍 为 2 至 今 最 小 值 为 1 至 今 最 小 值 仍 为 


216|1|3| L216l113| L2161113| 121611|3 
1 1 1 1 


(2) 知道 哪个 格子 的 值 最 小 之 后 ,将 该 格 与 本 次 检查 的 起 点 交换 。 第 1 次 检查 的 起 点 是 索引 0， 
第 2 次 是 索引 1， 以 此 类 推 。 下 图 展示 的 是 第 一 次 检查 后 的 交换 动作 。 


2 3 
NG 


116|2|3 
(3) 重复 第 (1) (2) 步 ， 直 至 数组 排 好 序 。 
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5.2 


于 是 记 下 其 索引 。 
至 今 最 小 值 为 4 
1412171113| 
个 


第 1 步 : 将 索引 1 的 值 2 与 目前 的 最 小 值 4 进行 比较 。 
最 小 值 =4 
2|71113 

1 
2 比 4 还 要 小 ， 于 是 将 目前 的 最 小 值 改 为 2。 
最 小 值 =2 
4|2171113 
人 
再 与 下 一 个 值 做 比较 。 因 为 7 大 于 2， 所 以 最 小 值 还 是 2。 
最 小 值 =2 
4|2171113 
1 

第 3 步 : 将 1 和 目前 的 最 小 值 做 比较 。 

最 小 值 =2 
4121711|3 
让 


1 比 2 还 要 小 ， 于 是 目前 的 最 小 值 更 新 为 1。 





开始 第 1 轮 检查 。 








选择 排序 实战 
以 数组 [4,2,7,1,3] 为 例 ， 步 又 如 下 。 
首先 读 取 索引 0。 根 据 此 算法 的 定义 ， 它 是 目前 遇 到 的 最 小 值 (因为 现在 只 检查 了 一 个 格子 )， 
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最 小 值 =1 


4|217113 
下 


第 4 步 : 比较 3 和 目前 的 最 小 值 1。 因 为 现在 已 经 走 到 数组 尽头 了 ， 所 以 可 以 断定 1 是 整个 
数组 的 最 小 值 。 





最 小 值 =1 


4|121711|13 


第 5 步 : 本 次 检查 的 起 点 是 索引 0, 不 管 那里 的 值 是 什么 , 我 们 都 应 该 将 最 小 值 1 换 到 那里 。 


tar 



































3 

















现在 1 就 排 到 正确 的 位 置 上 了 。 





j112171413 











可 以 开始 第 2 轮 检 查 了 。 


准备 工作 : 因为 索引 0 的 值 已 符合 其 排 位 ， 所 以 这 一 轮 从 下 一 个 格子 开始 ， 即 索引 1， 其 值 
为 2， 也 是 目前 本 轮 所 遇 到 的 最 小 值 。 





最 小 值 =2 


|1[2171413 
; 





第 6 步 : 将 7 跟 目 前 的 最 小 值 2 进行 比较 。 因 为 2 小 于 7， 所 以 最 小 值 仍 为 2。 


最 小 值 =2 


]1[2171413] 
1 
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第 7 步 : 将 4 跟 目 前 的 最 小 值 2 进行 比较 。 因 为 2 小 于 4， 所 以 最 小 值 仍 为 2。 
最 小 值 =2 
第 8 步 : 将 3 跟 目 前 的 最 小 值 2 进 行 比较 。 因 为 2 小 于 3， 所 以 最 小 值 仍 为 2。 


最 小 值 =2 


(1]2171413 
: 





























又 走 到 数组 尽头 了 。 本 轮 不 需要 做 任何 交换 ，2 已 在 其 正确 位 置 上 。 于 是 第 2 轮 检查 结束 ， 现 在 5 
数组 如 下 图 所 示 。 





RE 
WATTEEETYITEEEY 





开始 第 3 轮 检查 。 
准备 工作 : 从 索引 2 起 ， 其 值 为 7。 于 是 本 轮 目前 最 小 值 为 7。 


最 小 值 =7 


|112171413 





vl 
mr 


第 9 步 : 比较 4 与 7。 





最 小 值 =7 


|112171413 
+ 





将 4 记 为 目前 的 最 小 值 。 


最 小 值 =4 


RIA 
Tv 
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第 10 步 : 遇 到 3， 它 比 4 还 小 。 


最 小 值 -4 


RIA 
Tv 





于 是 3 成 了 目前 的 最 小 值 。 


最 小 值 -3 
个 
第 11 步 : 到 数组 尽头 了 ,将 3 跟 本 轮 起 点 7 进行 交换 。 
i 

















于 是 3 排 到 正确 位 置 上 了 。 








MM 
TO 









































准备 工作 : 此 轮 检查 从 索引 3 开始 ， 其 值 4 是 目前 的 最 小 值 。 
最 小 值 =4 


NAN 7 
ITCOOTOTOOODID 














第 12 步 : 比较 4 和 7。 
， 最 小 值 -4 


(11213147 
/ 











‘i 


4 仍 为 最 小 值 ， 而 且 它 也 处 于 本 轮 起 点 ， 因 此 无 须 任何 交换 。 


虽然 我 们 可 以 看 到 现在 整个 数组 都 有 序 了 ,但 计算 机 是 看 不 到 的 ， 它 只 会 继 乡 
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为 最 后 一 个 格子 左 侧 的 那些 值 都 已 在 各 自 的 正确 位 置 上 , 所 以 最 后 一 格 也 必然 正确 , 于 是 
排序 结束 。 




















EAT 
EYE 


SAVIIYYI 
ARTAYS 


5.3 选择 排序 的 实现 


以 下 是 用 Javascript 写 的 选择 排序 。 


function selectionSort(array) { 
for(var i = 0; i < array.length; i++) { 

var lowestNumberIndex = i; 

for(var j = i + 1; j < array.length; j++) { 
if(array[j] < array[LowestNumberIndex]) { 

lowestNumberIndex = j; 

} 

} 




















if(lowestNumberIndex != i) { 
var temp = array[il]; 
array[i] = array[lowestNumberIndex]; 
array[LowestNumberIndex] = temp; 
小 
} 
return array; 


} 

让 我 们 来 一 行 行 地 分 析 。 我 会 先 摘出 代码 片段 ， 然 后 给 出 解释 。 

for(var i = 0; i < array.length; I++) { 

这 个 外 层 的 循环 代表 每 一 轮 检查 。 在 一 轮 检 查 之 初 ， 我 们 会 先 记 住 目前 的 最 小 值 的 索引 。 


var LowestNumberIndex = i; 











因此 每 轮 开始 时 LowestNumberIndex 都 会 是 该 轮 的 起 点 索引 i。 注 意 我 们 实际 上 记录 的 是 
最 小 值 的 索引 ， 而 非 最 小 值 本 身 。 于 是 ， 第 1 轮 开始 时 最 小 值 的 索引 是 0， 到 第 2 轮 则 是 1， 以 
此 类 推 。 

for(var j = i + 1; j < array.length; j++) { 

此 行 代码 发 起 一 个 以 i + 1 开始 的 内 层 循环 。 


if(array[j] < array[LowestNumberIndex]) { 
lowestNumberIndex = j; 


} 





























循环 内 逐个 检查 数组 未 排序 的 格子 ， 若 遇 到 比 之 前 记录 的 本 轮 最 小 值 还 小 的 格子 值 ， 就 将 
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LowestNumberIndex 更 新 为 该 格子 的 索引 。 
内 层 循 环 结束 时 ， 会 得 到 未 排序 数值 中 最 小 值 的 索引 。 


if(lowestNumberIndex != i) { 
var temp = array[il]; 
array[i] = array[lowestNumberIndex]; 
array[LowestNumberIndex] = temp; 


} 


然后 再 看 看 这 个 最 小 值 是 否 已 在 正确 位 置 ， 即 该 索引 是 否 等 于 i。 如果 不 是 ,就 将 i 所 指 的 
值 与 最 小 值 交换 。 















































5.4 选择 排序 的 效率 


选择 排序 的 步骤 可 分 为 两 类 : 比较 和 交换 , 也 就 是 在 每 轮 检查 中 把 未 排序 的 值 跟 该 轮 已 遇 到 
的 最 小 值 做 比较 ， 以 及 将 最 小 值 与 该 轮 起 点 的 值 交 换 以 使 其 位 置 正确 。 


在 之 前 5 个 元 素 的 例子 里 ,我 们 总 共 进 行 了 10 次 比较 。 每 轮 分 别 如 下 。 











第 # 轮 # 次 比较 
1 4 
2 3 
3 2 
4 1 























于 是 4+3+2+1=10 次 比较 。 
推广 开 来 ， 若 有 N 个 元 素 ,就 会 (W- D+ (VW-2)+(V- 3)+…+1 次 比较 。 


但 每 轮 的 交换 最 多 只 有 1 次 。 如 果 该 轮 的 最 小 值 已 在 正确 位 置 ， 就 无 须 交 换 ， 和 否则 要 做 1 次 
交换 。 相 比 之 下 ， 冒 泡 排序 在 最 坏 情况 〈 完全 逆序 ) 时 ， 每 次 比较 过 后 都 要 进行 1 次 交换 。 


下 表 为 冒 泡 排序 和 选择 排序 的 并 列 对 比 。 



































N 个 元 素 冒 泡 排序 最 多 要 # 步 选择 排序 最 多 要 # 步 
5 20 14 (10 次 比较 +4 次 交换 ) 
10 90 54 (45 次 比较 + 9 次 交换 ) 
20 380 199 (180 次 比较 + 19 次 交换 ) 
40 1560 819 (780 次 比较 + 39 次 交换 ) 
80 6320 3239 (3160 次 比较 + 79 次 交换 ) 

















从 表 中 可 以 清晰 地 看 到 , 选择 排序 的 步 数 大 概 只 有 冒 泡 排序 的 一 半 ,， 即 选择 排序 比 冒 泡 排序 
快 一 倍 。 
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5.5 忽略 常数 


但 有 趣 的 是 ， 选 择 排序 的 大 O 记 法 跟 冒 泡 排 序 是 一 样 的 。 
还 记得 我 们 说 过 ， 大 0 记 法 用 来 表示 步 数 与 数据 量 的 关系 。 所 以 你 可 能 会 以 为 步 数 约 为 N? 
的 一 半 的 选择 排序 ， 其 大 0 会 写成 O(N? /2)， 以 表示 N 个 元 素 需 要 N? /2 步 。 如 下 表 所 示 。 















































N 个 元 素 N2/2 选择 排序 最 多 要 # 步 
5 57/2=12.5 14 
10 102/12=50 54 
20 202/2=200 199 
40 40*/2= 800 819 
80 80*/2= 3200 3239 





但 事实 上 , 选择 排序 的 大 O 记 法 为 O(N”), 跟 冒 泡 排 序 一 样 。 这 是 因为 大 O 记 法 的 一 条 重要 
规则 我 们 至 今 还 没 提 到 |: 

大 O 记 法 忽略 常数 。 

换 一 种 不 那么 数学 的 表达 方式 ， 就 是 : 大 O 记 法 不 包含 一 般 数字 ， 除 非 是 指数 。 

如 刚才 的 例子 ， 严格 来 说 本 应 为 OOV/2)， 最 终 得 写成 O(N”)。 类 似 地 ，O(2N) 要 写成 O(N); 
O(LV/2) 也 写成 O(N); 就 算是 比 O(N) 慢 100 倍 的 O(100N)， 也 要 写成 O(N)。 

速度 相差 100 倍 的 两 种 算法 , 它们 的 大 0 记 法 却 一 样 , 这 或 许 会 让 人 觉得 大 O 没什么 意义 。 
就 像 同 为 ON) 的 选择 排序 和 冒 泡 排序 ， 其 实 前 者 比 后 者 快 1 倍 ， 要 在 二 者 之 中 挑选 ， 无 疑 是 用 
选择 排序 。 


那么 , 大 O 还 赁 什么 值得 我 们 学 习 呢 ? 
































5.6 大 OO 的 作用 


尽管 不 能 比较 冒 泡 排序 和 选择 排序 ， 大 O 还 是 很 重要 的 ， 因 为 它 能 够 区 分 不 同 算法 的 长 期 
增长 率 。 当 数据 量 达到 一 定 程 度 时 ，O(N) 的 算法 就 会 永远 快 过 O(N”)， 无 论 这 个 O(CV) 实 际 上 是 
O(2 和 N) 还 是 O(100N)。 即 使 是 O(100N)， 这 个 临界 点 也 是 存在 的 。( 第 3 章 在 比较 一 个 100 步 的 算 
法 与 O(N) 算 法 时 ， 也 提 过 这 个 概念 ， 不 过 这 次 我 们 会 用 另 一 个 例子 来 讲解 。) 

下 图 为 OV) 和 O(N”) 的 对 比 。 

此 图 在 上 一 章 里 出 现 过 。 它 显示 了 不 管 数 据 量 是 多 少 ，O(N) 总 是 快 过 O(N”)。 

在 第 二 幅 图 中 ， 我 们 看 到 当 数 据 量 少 于 某 个 值 时 ，O(V9 是 比 O(100N) 要 快 的 ， 但 过 了 这 个 
值 之 后 ，O(100M) 便 反超 O(N”)， 并 一 直 保 持 优 热 。 
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步 数 

















OUOON) 















































元 素数 量 

这 就 是 大 0 记 法 忽略 常数 的 原因 。 大 0 记 法 只 表明 ， 对 于 不 同 分 类 ， 存 在 一 临界 点 ， 在 这 
一 点 之 后 ， 一 类 算法 会 快 于 男 一 类 ， 并 永远 保持 下 去 。 至 于 这 个 点 在 哪里 ， 大 O 并 不 关心 。 

因此 ， 不 需要 写成 O(100N)， 归 类 到 O(N) 就 好 了 。 

同样 地 ， 在 数据 量 增 大 到 某 个 点 时 ，O(log M) 便 会 永远 超越 O(N)， 即 使 该 O(log N) 算 法 的 实 
际 步 数 为 O(2log N)。 

所 以 大 O 是 极为 有 用 的 工具 ， 当 两 种 算法 落 在 不 同 的 大 O 类 别 时 ， 你 就 很 自然 地 知道 应 该 
选择 哪 种 。 因 为 在 大 数据 的 情况 下 ， 必 然 存 在 一 临界 点 使 这 两 种 算法 的 速度 永远 区 分 开 来 。 

不 过 ,本 章 的 主要 结论 是 即使 两 种 算法 的 大 O 记 法 一 样 ， 但 实际 速度 也 可 能 并 不 一 样 。 虽 然 
选择 排序 比 冒 泡 排序 快 1 倍 ， 但 它们 的 大 O 记 法 都 是 OOM。 因 此 ,大 O 记 法 非常 适合 用 于 不 
同 大 O 分 类 下 的 算法 的 对 比 ， 对 于 大 0 同类 的 算法 ， 我 们 还 需要 进一步 的 解析 才能 分 辨 出 具体 
差异 。 














5.7 一 个 实例 


假设 你 要 写 一 个 Ruby 程序 ， 从 一 个 数组 里 取出 间隔 的 元 素 ， 来 组 成 新 的 数组 。 你 可 能 会 用 
数组 的 each_with_index 方法 来 做 如 下 遍历 。 








def every other(array) 
new array = [] 


array.each with index do |element, index| 
new array << element if index.even? 
end 


return new array 
end 


它 迭 代 原 数组 的 每 一 个 元 素 ， 如 果 元 素 索 引 值 为 偶数 ， 则 将 该 元 素 插入 到 新 数组 里 。 

分 析 其 中 步骤 , 会 发 现 它 们 可 分 为 两 种 : 一 种 是 读 取 数 组 元 素 , 另 一 种 是 插入 元 素 到 新 数组 。 

因为 要 读 取 数组 的 每 一 个 元 素 , 所 以 读 取 有 N 步 。 插 入 则 只 有 N/2 步 ,因为 只 有 间隔 的 元 素 
才 被 放 到 新 数组 里 。 从 技术 上 来 说 ，N 次 读 取 加 N/2 次 插入 ,这 算法 的 效率 应 该 是 OOV+ (V/2))， 
或 者 是 O(1.5N)。 但 因为 大 O 记 法 要 把 常数 丢掉 ， 所 以 只 写成 O(N)。 

此 算法 虽然 能 达到 效果 ， 但 我 们 还 是 要 再 审视 一 下 它 有 没有 提升 的 空间 。 事 实 上 ， 有 。 

与 其 迭代 每 个 元 素 并 检查 它们 的 索引 是 否 为 偶数 ， 不 如 只 读 取 数 组 中 间隔 的 元 素 。 

def every other(array) 


new array = [] 
index = 0 




































































while index < array.Length 
new array << array[index] 
index += 2 

end 


return new array 
end 


这 种 做 法 的 while 循环 会 跳 过 间隔 的 元 素 ， 因 此 避免 了 检查 每 个 元 素 。 结 果 就 是 有 N 个 元 
素 ， 会 有 N/2 次 读 取 ，V/2 次 插入 。 它 跟 第 一 种 做 法 一 样 ， 记 为 O(N)。 

然而 ,第 一 种 做 法 实际 有 1.3SV 步 , 比 只 有 V 步 的 第 二 种 明显 要 慢 。 虽然 第 一 种 的 写法 在 Ruby 
界 更 为 惯用 ， 但 如 果 要 处 理 的 数据 量 庞大 ， 不 妨 尝试 第 二 种 ， 以 获得 性 能 的 飞升 。 
































5.8 总结 


现在 我 们 已 经 掌握 了 一 些 非 常 强大 的 算法 分 析 手 法 。 我 们 能 够 使 用 大 O 去 判断 各 种 算法 的 效 
率 ， 即 便 两 种 算法 的 大 O 记 法 一 样 ， 也 知道 如 何 对 比 它们 。 

不 过 在 对 比 算法 时 , 还 需要 考虑 一 个 重要 因素 。 至 今 我 们 关注 的 都 是 最 坏 情况 下 算法 会 跑 得 
多 慢 , 但 其 实 最 坏 情况 并 不 总 会 发 生 。 没 错 ,， 我 们 遇 到 的 大 都 是 平均 情况 。 下 一 章 ， 我 们 会 学 习 
怎样 顾及 所 有 情况 。 
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之 前 我 们 衡量 一 个 算法 的 效率 时 ,都 是 着 眼 于 它 在 最 坏 情 况 下 需要 多 少 步 。 原 因 很 简单 ， 连 
最 坏 的 情况 都 做 足 准备 了 ， 其 他 情况 自然 不 在 话 下 。 

然而 ,本 章 会 告诉 你 最 坏 情况 不 是 唯一 值得 考虑 的 情况 。 全 面 分 析 各 种 情况 ,能 帮助 你 为 不 
同 场景 选择 适当 的 算法 。 


























6.1 插入 排序 


我 们 已 经 学 过 两 种 排序 算法 : 冒 泡 排序 和 选择 排序 。 虽 然 它们 的 效率 都 是 O(N”)， 但 其 实 选 
择 排 序 比 冒 泡 排 序 快 一 倍 。 现 在 来 学 第 三 种 排序 算法 一 一 插入 排序 。 你 会 发 现 , 顾及 最 坏 情况 以 
外 的 场景 将 是 多 么 有 用 。 
插入 排序 包括 以 下 步骤 。 

(1) 在 第 一 轮 里 , 暂时 将 索引 1 (第 2 格 ) 的 值 移 走 ， 并 用 一 个 临时 变量 来 保存 它 。 这 使 得 该 
索引 处 留 下 一 个 空隙， 因为 它 不 包含 值 。 


8141213 
14| 
8 [213 


在 之 后 的 轮回 ， 我 们 会 移 走 后 面 索 引 的 值 。 
(2) 接着 便 是 平移 阶段 ， 我 们 会 拿 空隙 左 侧 的 每 一 个 值 与 临时 变量 的 值 进行 比较 。 
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日 


果 空 隙 左 侧 的 值 大 于 临时 变量 的 值 ， 则 将 该 值 右 移 一 格 。 


14 
[8[213 
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妇 





I 

















随 着 值 右 移 ， 空 际会 左 移 。 如 果 遇 到 比 临 时 变量 小 的 值 ， 或 者 空 际 已 经 到 了 数组 的 最 左 


(3) 将 临时 移 走 的 值 插 入 当前 空隙 。 
女 ~ 


4181213 


(4) 重复 第 (1) 至 (3) 步 ， 直 至 数组 完全 有 序 。 





6.2 插入 排序 实战 


下 面 尝 试 对 [4，2，7，1，3] 数 组 运用 插入 排序 。 
第 1 轮 先 从 索引 1 开始， 其 值 为 2。 


4121711|3 
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准备 工作 : 暂时 移 走 2， 并 将 其 保存 在 变量 temp_value 中 。 图 中 被 移 到 数组 上 方 的 就 是 


征 
temp_value。 
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第 1 步 : 比较 4 与 temp_value 中 的 2。 
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第 2 步 : 因为 4 大 于 2， 所 以 把 4 右 移 。 
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于 是 空隙 移 到 了 数组 最 左 端 ， 没 有 其 他 值 可 以 比较 了 。 
第 3 步 : 将 temp_value 插 回 数组 ， 完 成 第 一 轮 。 
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开始 第 2 轮 。 
准备 工作 : 暂时 移 走 索引 2 的 值 ， 并 保存 到 temp_value 中 。 于 是 temp_value 等 于 7。 


7 
2141113 


























第 4 步 : 比较 4 与 temp_value。 


7 
24 1|13 


























4 小 于 7， 所 以 无 须 平移 。 因 为 遇 到 了 小 于 temp_vatLue 的 值 ， 所 以 平移 阶段 结束 。 
第 5 步 : 将 temp_value 搬 回 到 空隙 中 ， 结 束 第 2 轮 。 
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开始 第 3 轮 。 
准备 工作 : 暂时 移 走 1， 并 将 其 保存 到 temp_value 中 。 
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和 6 步 : 比较 7 与 temp_value。 











3 








第 7 步 : 7 大 于 1， 于 是 将 7 右 移 。 


2 各 


1 
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有 8 步 : 比较 4 与 temp_value。 


和 9 步 : 4 大 于 1， 于 是 也 要 将 4 右 移 。 
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和 10 步 : 比较 2 与 temp_value。 
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A 
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区 11 步 : 2 比较 大 ， 所 以 将 2 右 移 。 




















3 
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第 12 步 : 空隙 到 了 数组 最 左 端 ， 因 此 我 们 将 temp_value 插 ; 


开始 第 4 轮 。 
准备 工作 : 暂时 移 走 索引 4 的 值 3， 保 存 到 temp_value 中 。 








第 13 步 : 


第 14 步 : 


第 15 步 : 


第 16 步 : 
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, 








比较 7 和 temp_value。 














7 更 大 ， 于 是 将 7 右 移 。 


比较 





























4 与 temp_value。 








112 

















4 大 于 3， 所 以 将 4 右 移 。 
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第 17 步 : 比较 2 与 temp_value。2 小 于 3， 于 是 平移 阶段 完成 。 


3 
4 4 


第 18 步 : 把 temp_vatLue 插 回 到 空隙 。 














三 
112131417 














至 此 整个 数组 都 排 好 序 了 。 
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6.3 ”插入 排序 的 实现 


以 下 是 插入 排序 的 Python 实现 。 


def insertion sort(array): 
for index in range(1，Len(array) ) : 




















position = index 
temp_value = array[index] 


while position > 0 and array[position - 1] > temp value: 
array[position] = array[position - 1] 
position = position - 1 


array[position] = temp_value 
证 我 们 来 一 步 步 地 讲解 。 我 会 先 摘出 代码 片段 ， 然 后 给 出 解释 。 
for index in range(1，Len(array) ) : 
首先 ， 发 起 一 个 从 索引 1 开始 的 循环 来 遍历 数组 。 变 量 index 保存 的 是 当前 索引 。 


position = index 
temp_value = array[index] 


接着 ， 给 position 赋值 为 index， 给 temp_value 赋值 为 index 所 指 的 值 。 


while position > 0 and array[position - 1] > temp value: 
array[position] = array[position - 1] 
position = position - 1 
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然后 在 内 部 发 起 一 个 while 循环 , 以 检查 position 左 侧 的 值 是 否 大 于 temp_value。 若是 ， 
则 用 array[position] = array[position - 1] 将 该 值 右 移 一 格 ， 并 将 position 减 1。 然 后 
继续 检查 新 position 左 侧 的 值 是 否 大 于 temp_vatLue.……… 如 此 重复 ， 直 至 遇 到 的 值 比 


temp_value 小 。 











array[position] = temp value 


最 后 ,将 temp_value 放 回 到 数组 的 空隙 中 。 





6.4 插入 排序 的 效率 

插入 排序 包含 4 种 步骤 : 移 除 、 比 较 、 平 移 和 插入 。 要 分 析 插 入 算法 的 效率 ， 就 得 把 每 种 步 
又 都 统计 一 遍 。 

首先 看 看 比较 。 每 次 拿 temp_value 跟 空隙 左 侧 的 值 比 大 小 就 是 比较 。 


在 数组 完全 道 序 的 最 坏 情 况 下 ， 我 们 每 一 轮 都 要 将 temp_value 左 侧 的 所 有 值 与 
temp_value 比较 。 因 为 那些 值 全 都 大 于 temp_vaLue， 所 以 每 一 轮 都 要 等 到 空隙 移 到 最 左 端 才 


台 EZ 士 
能 结 O 〇 


在 第 一 轮 ，temp_value 为 索引 1 的 值 ， 由 于 temp_value 左 侧 只 有 一 个 值 ， 所 以 最 多 进行 
一 次 比较 。 到 了 第 二 轮 ， 最 多 进行 两 次 比较 ， 以 此 类 推 。 到 最 后 一 轮 时 ， 就 要 拿 temp_value 以 
外 的 所 有 值 与 其 进行 比较 。 换言之 , 如 果 数 组 有 NN 个 元 素 , 则 最 后 一 轮 中 最 多 进行 N- 1 次 比较 。 


因而 可 以 得 出 比较 的 总 次 数 为 : 

1+2+3+…+N-1 次 。 

对 于 有 5 个 元 素 的 数组 ， 最 多 需要 : 

1+2+3+4=10 次 比较 。 

对 于 有 10 个 元 素 的 数组 ， 最 多 需要 : 

1+2+3+4+5+6+7+8+9=45 次 比较 。 

(对 于 有 20 个 元 素 的 数组 ， 最 多 需要 190 次 比较 ， 以 此 类 推 。 ) 

由 此 可 发 现 一 个 规律 : 对 于 有 N 个 元 素 的 数组 ， 大 约 需要 NV7 2 次 比较 (10/2 是 50，207 2 
是 200 )。 

接 下 来 看 看 其 他 几 种 步 又。 

我 们 每 次 将 值 右 移 一 格 , 就 是 平移 操作 。 当 数 组 完全 逆序 时 , 有 多 少 次 比较 就 要 多 少 次 平移 ， 
因为 每 次 比较 的 结果 都 会 使 你 将 值 右 移 。 
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巴 最 坏 情 况 下 的 比较 步 数 和 平移 步 数 相 加 。 
N2 2 次 比较 
+ N72 次 平移 


at 





六 步 

temp_value 的 移 除 跟 插入 在 每 一 轮 里 都 会 各 发 生 一 次 。 因 为 总 是 有 N- 工 轮 , 所 以 可 以 得 出 
结论 : 有 N=- 1 次 移 除 和 N=-1 次 插入 。 

把 它们 都 相 加 。 

六 比较 和 平移 的 合计 
+N- 1 次 移 除 


+N-1 次 插入 

















N*+2N-2 步 

我 们 已 经 知道 大 O 有 一 条 重要 规则 一 一 忽略 常数 ， 于 是 你 可 能 会 将 其 简化 成 O(N?+ N)。 

不 过 ， 现 在 来 学 习 一 下 大 O 的 另 一 条 重要 规则 

大 O 只 保留 最 高 阶 的 N。 

换 名 话说， 如 果 有 个 算法 需要 NM +N +N+N 步 ,我 们 就 只 会 关注 其 中 的 Y， 即 以 O(N”) 
来 表示 。 为 什么 呢 ? 


























请 看 下 表 。 
N MN MN NM 
2 4 8 16 
§ 25 125 625 
10 100 1000 10 000 
100 10 000 1 000 000 1 000 000 000 
1000 1 000 000 1 000 000 000 1 000 000 000 000 


随 着 X 的 变 大 ，NV 的 增长 越 来 越 抛 离 其 他 阶 。 当 NWN 为 1000 时 , N* 就 比 W 大 了 1000 倍 。 
此 ， 我 们 只 关心 最 高 阶 的 N。 

所 以 在 插 和 人 排序 的 例子 中 ，O(V + 入 ) 还 得 进一步 简化 成 O(N”)。 

你 会 发 现 , 在 最 坏 的 情况 里 , 插入 排序 的 时 间 复 杂 度 跟 冒 泡 排 序 、 选 择 排 序 一 样 , 都 是 O(N )。 
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不 过 上 一 章 曾 指出 ， 虽 然 冒 泡 排 序 和 选择 排序 都 是 O(N”)， 但 选择 排序 实际 上 是 N?/ 2 步 ， 
比 入 步 的 冒 泡 排 序 更 快 ,在 一 看 , 你 可 能 会 觉得 插入 排序 跟 冒 泡 排 序 一 样 , 因为 它们 都 是 O(N”)， 
其 实 插 入 排序 是 N*+2N -2 步 。 

如 果 本 书 到 此 为 止 ， 你 或 许 会 认为 比 冒 泡 排 序 和 插入 排序 快 一 倍 的 选择 排序 是 三 者 中 最 优 
的 ， 但 事情 并 没有 这 么 简单 。 






































6.5 平均 情况 


确实 ， 在 最 坏 情况 里 ， 选 择 排 序 比 插入 排序 快 。 但 是 我 们 还 应 该 考虑 平均 情况 。 

为 什么 呢 ? 

所 请 平均 情况 ,就 是 那些 最 常 遇见 的 情况 。 最 坏 情 况 和 最 好 情况 都 是 不 常见 的 。 看 下 面 这 个 
钟 形 的 曲线 。 


































































































半 
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最 坏 情 况 平均 情况 最 好 情况 

















最 好 情况 和 最 坏 情况 很 少 发 生 。 现 实 世界 里 ， 最 常 出 现 的 是 平均 情况 。 
是 很 有 道理 的 。 你 设想 一 个 随便 洗 乱 的 数组 ,出 现 完全 升序 或 完全 降序 的 可 能 性 有 多 大 ? 
最 可 能 出 现 的 情况 应 该 是 随机 分 布 。 

下 面试 试 在 各 种 场景 中 测试 插入 排序 。 

完全 降序 的 最 坏 情况 之 前 已 经 见 过 , 它 每 一 轮 都 要 比较 和 平移 所 遇 到 的 值 ( 这 两 种 操作 合计 
N 步 )。 

对 于 完全 升序 的 最 好 情况 , 因为 所 有 值 都 已 在 其 正确 的 位 置 上 , 所 以 每 一 轮 只 需要 一 次 比较 ， 
完全 不 用 平移 。 

但 若是 随机 分 布 的 数组 ， 你 就 可 能 要 在 一 轮 里 进行 比较 并 平移 所 有 数据 、 部 分 数据 ， 或 无 须 
平移 。 回 头 看 看 之 前 步骤 分 解 的 例子 ， 可 以 发 现在 第 1、3 轮 ， 我们 比较 并 平移 了 所 有 遇 到 的 数 
据 。 在 第 4 轮 ， 我 们 只 对 部 分 数据 进行 了 操作 。 在 第 2 轮 ， 则 没有 平移 ， 只 有 一 次 比较 。 
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最 坏 情况 是 所 有 数据 都 要 比较 和 平移 ; 最 好 情况 是 每 轮 一 次 比较 、 零 次 平移 ; 对 于 平均 情况 ， 
总 的 来 看 ， 是 比较 和 平移 一 半 的 数据 。 

如 果 说 插入 排序 的 最 坏 情 况 需要 N? 步 ， 那 么 平均 情况 就 是 N? / 2 步 。 尽 管 最 终 大 O 都 会 写 
成 O(N”)。 

来 看 一 些 具体 的 例子 。 

最 好 情况 就 像 [1 ,2, 3, 4], 已 经 预先 排 好 序 。 用 同样 的 数据 ， 最 坏 情况 就 是 [4, 3, 2, 1]。 
平均 情况 ， 则 如 [1，3，4，2]。 

这 里 的 最 坏 情 况 需要 6 次 比较 和 6 次 平移 ， 共 12 步 。 平均 情况 需要 4 次 比较 和 2 次 平移 ， 
共 6 步 。 最 好 情况 是 3 次 比较 、0 次 平移 。 

可 以 看 到 插入 排序 的 性 能 在 不 同 场景 中 差异 很 大 。 最 坏 、 平 均 、 最 好 情况 ,分 别 需要 NM?、 
NM /2、N 步 。 

这 是 由 于 有 些 轮 次 需要 比较 temp_value 左 侧 的 所 有 值 ， 有 些 轮 次 却 因为 遇 到 了 小 于 
temp_value 的 值 而 提早 结束 。 

3 种 情况 的 步 数 如 下 图 所 示 。 
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步 数 
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元 素数 量 





再 跟 选 择 排序 对 比 一 下 。 选 择 排序 是 无 论 何 种 情况 ， 最 坏 、 平 均 、 最 好 ， 都 要 NN/2 步 。 
因为 这 个 算法 没有 提早 结束 某 一 轮 的 机 制 ， 不 管 遇 到 什么 ， 每 一 轮 都 得 比较 所 选 索引 右边 的 所 
有 值 。 

那么 哪 种 算法 更 好 ? 选择 排序 还 是 搬入 排序 ” 答案 是 : 看 情况 。 对 于 平均 情况 (数组 里 的 值 
随机 分 布 )， 它 们 性 能 相近 。 如 果 你 确信 数组 是 大 致 有 序 的 ， 那 么 插入 排序 比较 好 。 如 果 是 大 致 
逆序 ， 则 选择 排序 更 快 。 如 果 你 无 法 确定 数据 是 什么 样 ， 那 就 算是 平均 情况 了 ， 两 种 都 可 以 。 
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6.6 一 个 实例 


假设 你 在 写 一 个 Javascript 应 用 ， 你 需要 找 出 其 中 两 个 数组 的 交集 。 所 谓 交 集 ， 就 是 两 个 数 
组 都 有 的 值 所 组 成 的 集合 。 举 个 例子 ，[3，1，4，2]1 和 [4，5，3，6] 的 交集 为 [3，4] ， 因 为 
两 个 数组 都 有 3 和 4。 

Javascript 并 没有 自 带 求 交 集 的 函数 ， 因 此 我 们 只 能 自己 写 一 个 。 以 下 是 其 中 一 种 写法 。 


function intersection(first array, second array){ 
var result = []; 


























for (var i = 0; i < first array.length; i++) { 
for (var j = 0; j < second array.length; j++) { 
if (first array[i] == second array[j]) { 
result.push(first array[i]); 
} 
} 
} 


return result; 


} 

它 运 用 了 一 个 简单 构 套 循环 。 外 部 循环 用 来 遍历 第 一 个 数组 ,并 在 每 遇 到 一 个 值 时 ,就 发 起 
内 部 循环 去 检查 第 二 个 数组 有 没有 值 与 其 相同 。 

此 算法 有 两 种 步骤 : 比较 和 插入 。 也 就 是 将 两 个 数组 的 所 有 值 相互 比较 ， 并 把 相同 的 值 插入 
到 result。 插入 的 步 数 微不足道 ， 因 为 即使 两 个 数组 完全 一 至， 步 数 也 不 过 是 其 中 一 个 数组 的 
数据 量 。 所 以 这 里 主要 考虑 的 是 比较 。 

要 是 两 个 数组 同样 大 小 ， 那 么 比较 需要 N* 步 。 这 是 因为 数组 一 的 每 个 值 ， 都 要 与 数组 二 的 
每 个 值 进 行 对 比 。 于 是 ， 两 个 数据 量 都 为 5 的 数组 ， 最 终 会 比较 25 次 。 这 种 算法 效率 为 O(N”)。 

(如 果 数 组 大 小 不 一 ， 比 如 说 分 别 含 N、M 个 元 素 ， 那 么 此 过 程 的 步 数 就 是 O(N x M)， 但 简 
单 起 见 ， 就 当 它 们 大 小 一 样 吧 。) 

那 能 不 能 改进 一 下 呢 ? 

这 就 是 为 什么 我 们 不 能 只 考虑 最 坏 情 况 的 原因 了 。 以 现在 的 intersection 函数 的 实现 , 无 
论 遇 到 什么 情况 都 是 O(N”) 的 ， 不管 你 输入 的 两 个 数组 完全 不 同 还 是 完全 相同 。 

如 果 两 个 数组 真 的 没有 交集 ， 那 你 别 无 选择 ， 只 能 检查 完 每 个 值 才能 确定 。 

但 若是 二 者 有 交集 , 我 们 其 实 不 用 拿 数组 一 的 每 个 值 去 跟 数组 二 的 每 个 值 对 比 。 下 面 我 就 来 
解释 为 什么 。 
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在 以 上 例子 中 , 一 旦 找到 一 个 共有 的 值 (8 )， 那 就 没 必 要 跑 完 内 部 循环 了 。 再 跑 下 去 是 为 了 
查 什么 呢 ? 既然 知道 数组 二 中 也 存在 数组 一 的 那个 值 这 就 够 了 。 
要 下 的话 ， 加 一个 人 人 就 可 以: 


function intersection(first array, second array){ 
var result = []; 


OO 
| 
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for (var i = 0; i < first array.length; i++) { 
for (var j = 0; j < second array.length; j++) { 


if (first array[i] == second array[j]) { 
result.push(first array[i]); 
break; 


} 
} 


return result; 
} 
break 可 以 中 断 内 部 循环 ， 节 省 步 数 和 时 间 。 
这 样 的 话 ， 在 没有 交集 的 最 坏 情 况 下 ， 我 们 仍然 要 做 N 次 比较 ; 在 数组 完全 一 样 的 最 好 情 
况 下 ， 就 只 需要 NWN 次 比较 ; 在 数组 不 同 但 有 部 分 重复 的 平均 情况 下 ， 步 数 会 介 于 N 到 入 之 间 。 
性 能 提升 是 很 明显 的 ， 因 为 在 最 初 的 实现 里 ， 无 论 什 么 情况 ， 步 数 都 是 N?。 












































6 . 7 总 结 
懂得 区 分 最 好 、 平 均 、 最 坏 情况 ,是 为 当前 场景 选择 最 优 算法 以 及 给 现 有 算法 调 优 以 适应 环 
境 变化 的 关键 。 记 住 , 虽然 为 最 坏 情 况 做 好 准备 十 分 重要 , 但 大 部 分 时 间 我 们 面 对 的 是 平均 情况 。 
下 一 章 我 们 会 学 习 一 种 跟 数 组 类 似 的 数据 结构 ， 它 的 一 些 特点 使 其 在 某 些 场 景 中 的 性 能 优 于 
数组 。 就 像 现在 你 得 根据 需求 选择 合适 的 算法 , 数据 结构 的 性 能 也 有 差异 , 你 也 需要 为 此 做 出 选择 。 
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试想 你 在 写 一 个 快餐 店 的 点 单程 序 , 准备 实现 一 个 展示 各 种 食物 及 相应 价格 的 菜单 。 你 可 能 
会 用 数组 来 做 ( 当然 这 没 问题 )。 

menu = [ ["french fries", 0.75], ["hamburger", 2.5], ["hot dog", 1.5], ["soda", 0.6] ] 

该 数组 由 一 些 子 数组 构成 ， 每 个 子 数组 包含 两 个 元 素 。 第 一 个 元 素 是 表示 食物 名 称 的 字符 
串 ， 第 二 个 元 素 是 该 食物 的 价格 。 

就 如 第 2 章 学 到 的 ， 在 无 序 的 数组 里 查找 某 种 食物 的 价格 ， 得 用 线性 查找 ， 需 要 O(N) 步 。 
有 序数 组 则 可 以 用 二 分 查找 ， 只 需要 O(log 入 ) 步 。 
尽管 Odog NM) 也 不 错 ， 但 我 们 可 以 做 得 更 好 。 事 实 上 ， 可 以 好 很 多 。 到 了 本 章 结尾 ， 你 会 掌 
握 一 种 名 为 散 列 表 的 数据 结构 , 只 用 O(1) 步 就 能 找 出 数据 。 理解 此 数据 结构 的 原理 以 及 其 适用 场 
景 ， 你 就 能 依靠 其 快速 查找 的 能 力 来 应 对 各 种 状况 。 
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7.1 探索 散 列 表 

大 多 数 编程 语言 都 自 带 散 列 表 这 种 能 够 快速 读 取 的 数据 结构 。 但 在 不 同 的 语言 中 , 它 有 不 同 
的 名 字 ， 除 了 散 列 表 ， 还 有 散 列 、 映 射 、 散 列 映射 、 字 典 、 关 联 数组 。 

以 下 便 是 用 Ruby 的 散 列 表 来 实现 的 菜单 。 

menu = { "french fries" => 0.75, "hamburger" => 2.5, "hot dog" => 1.5, "soda" => 0.6 } 


散 列 表 由 一 对 对 的 数据 组 成 。 一 对 数据 里 ,一 个 叫 作 键 ， 另 一 个 叫 作 值 。 键 和 值 应 该 具有 某 
种 意义 上 的 关系 。 如 上 例 ，"french fries" 是 键 ，0.75 是 值 ， 把 它们 组 成 一 对 就 表示 “ 炸 划 条 
的 价格 为 75 美 分 ”。 

在 Ruby 中 ， 查 找 一 个 键 所 对 应 的 值 ， 语 法 是 : 

menu["french fries"] 
这 会 返回 值 0.75。 

在 散 列表 中 查找 值 的 平均 效率 为 0(1)， 因 为 只 要 一 步 。 下 面 来 看 看 为 什么 。 
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7.2 用 散 列 浮 数 来 做 散 列 
还 记得 你 小 时 候 创建 和 解析 密 文 时 用 的 密码 吗 ? 
例如 以 下 这 种 字母 和 数字 的 简单 转化 方式 。 


mi DNmri 
| | | 
PROD 


以 此 类 推 。 
由 此 可 得 , ACE 会 转化 为 135, CAB 会 转化 为 312, DAB 会 转化 为 412, BAD 会 转化 为 214。 
将 字符 串 转 为 数字 串 的 过 程 就 是 散 列 ， 其 中 用 于 对 照 的 密码 ， 就 是 散 列 函数 。 


当然 散 列 函数 不 只 是 这 一 种 ， 例 如 对 各 字母 匹配 的 数字 求 和 的 过 程 ， 也 可 以 作为 散 列 函数 。 
按 此 函数 来 做 的 话 ，BAD 就 是 7， 过 程 如 下 。 


第 1 步 : BAD 转 成 214。 

第 2 步 : 把 每 一 位 数字 相 加 ，2 +1+4=7。 
散 列 函数 也 可 以 是 对 各 字母 匹配 的 数字 求 积 的 过 程 。 这 样 的 话 ，BAD 就 会 得 出 8。 

第 1 步 : BAD 转 成 214。 

第 2 步 : 把 每 一 位 数字 相 乘 ，2x1x4=8。 


本 章 剩余 部 分 将 会 采用 最 后 一 种 散 列 函 数 。 虽然 现实 世界 中 的 散 列 函数 比 这 复杂 得 多 , 但 以 
简单 的 乘法 函数 为 例会 比较 易 懂 。 


一 个 散 列 函数 需 满足 以 下 条 件 才 有 效 : 每 次 对 同一 字符 串 调用 该 散 列 函数 , 返回 的 都 应 是 同 
一 数字 捉 。 如 果 每 次 都 返回 不 一 样 的 结果 ， 那 就 无 效 。 


例如 , 计算 过 程 中 使 用 随机 数 或 当前 时 间 的 函数 就 不 是 有 效 的 散 列 函数 。 这 种 函数 会 将 BAD 
一 下 转 成 12， 一 下 又 转 成 106。 


我 们 刚才 的 乘法 函数 就 只 会 把 BAD 转 成 8。 因 为 B 总 是 2, A 总 是 1, D 总 是 4, 2x1x4 
会 是 8， 不 可 能 有 其 他 输出 。 


注意 ， 经 由 此 函数 转换 ，DAB 也 会 得 到 8， 跟 BAD 一 样 。 这 确实 会 带 来 一 些 问 题 ， 我 们 之 
后 会 说 明 。 


认识 了 散 列 函数 ， 就 可 以 进一步 学 习 散 列表 的 运作 了 。 
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7.3 一 个 好 玩 又 赚钱 的 同义词 典 


假设 工作 之 余 , 你 还 一 个 人 秘密 研发 着 一 款 将 要 征服 世界 的 软件 。 那 是 一 个 同义词 典 , 它 叫 
Quickasaurus。 你 相信 它 势 必 一 鸣 惊 人 ， 因 为 它 只 会 返回 一 个 最 常用 的 同义词 ， 而 不 是 像 其 他 词 
典 那 样 ， 返 回 所 有 的 同义词 。 

因为 每 个 词 都 有 一 个 同义词 ， 所 以 正好 作为 散 列 表 的 用 例 。 毕 竞 , 散 列 表 就 是 一 堆 成 对 的 元 
素 。 下 面 我 们 马上 来 开发 。 

该 词典 可 以 用 一 个 散 列表 来 表示 。 

thesaurus = {} 


散 列表 可 以 看 成 是 一 行 能 够 存储 数据 的 格子 ,就 像 数 组 那样 。 每 个 格子 都 有 对 应 的 编号 ， 如 
下 所 示 。 





















































1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
现在 往 散 列表 里 加 入 我 们 的 第 一 条 同义词 。 


thesaurus["bad"] = "evil" 
散 列 表 变 成 了 下 面 这 样 。 


{ "bad" => "evil"} 
再 看 看 散 列 表 是 如 何 存储 数据 的 。 


首先 , 计算 机 用 散 列 函数 对 键 进行 计算 。 为 了 方便 演示 ,这 里 我 们 依然 使 用 之 前 提 及 的 那个 
乘法 函数 。 
BAD=2*1*4=8 


"bad" 的 散 列 值 为 8， 于 是 计算 机 将 "evil" 放 到 第 8 个 格子 里 。 












































1 2 3 4 5 6 7 8 9 1 1l1 12 13 14 15 16 
接着 ， 我 们 再 试 另 一 对 键 值 。 
thesaurus["cab"] = "taxi" 


同样 地 ， 计 算 机 要 计算 散 列 值 。 


CAB=3*1*2=6 
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结果 为 6， 所 以 将 "taxi" 放 到 第 6 格 。 








1 10 11 1l13 14 15 16 








再 多 加 一 对 试 试 。 
thesaurus["ace"] = "star" 


ACE 的 散 列 值 为 15 (ACE=1x3x5=15)， 于 是 "star" 被 放 到 第 15 格 。 

















10 11 1l13 14 15 16 


现在 ， 用 代码 来 表示 这 个 散 列表 的 话 ， 就 是 这 样 : 

{"bad" => "evil", "cab" => "taxi", "ace" => "star"} 

既然 散 列表 词典 建 好 了 ， 那 就 来 看 看 从 里 面 查 词 时 会 发 生 什么 吧 。 假设 现在 要 查 "bad" 的 同 
义 词 ， 写 成 代码 的 话 ， 如 下 所 示 。 

thesaurus["bad"] 

收 到 命令 后 ， 计 算 机 就 会 进行 如 下 两 步 简单 的 操作 。 

(1) 计算 这 个 键 的 散 列 值 : BAD=2x1x4=8。 

(2) 由 于 结果 是 8， 因 此 去 到 第 8 格 并 返回 其 中 的 值 。 在 本 例 中 ， 该 值 为 "evil"。 

这 下 你 应 该 明白 为 什么 从 散 列 表 里 读 取 数 据 只 需要 O(1) 了 吧 ， 因 为 其 过 程 所 花 的 时 间 是 恒 
定 的 。 它 总 是 先 计 算出 键 的 散 列 值 ， 然 后 根据 散 列 值 跳 到 对 应 的 格子 去 。 


现在 总 算 理 解 为 什么 我 们 的 快餐 店 菜单 用 散 列表 会 比 用 数组 要 快 了 。 当 要 查询 某 种 食物 的 价 
格 时 ， 如 果 是 用 数组 ， 那 么 就 得 一 个 格子 一 个 格子 地 去 找 ， 直 至 找到 为 止 。 无 序数 组 需要 O(N)， 
有 序数 组 需要 O(log N)。 但 用 散 列 表 的 话 ， 我们 就 能 够 以 食物 作为 键 来 做 0(1) 的 查找 。 这 就 是 散 
列表 的 好 处 。 
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过 ， 散 列表 也 会 带 来 一 些 麻 烦 。 
继续 同义词 典 的 例子 : 把 下 面 这 条 同义词 也 加 到 表 里 ， 会 发 生 什么 呢 ? 


thesaurus["dab"] = "pat" 
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首先 ， 计 算 散 列 值 。 
DAB =4*1*2=8 


然后 ,将 "pat" 放 进 第 8 个 格子 。 





"taxi" "evil” "star” 








1 2 3 4 5 6 7 8 9 1 1l1 12 13 14 15 16 

















噢 ,第 8 格 已 经 是 "evil" 了 ， 这 的 确 不 好 ( evil )。 

往 已 被 占用 的 格子 里 放 东 西 ， 会 造成 冲突 。 幸 好 ， 我 们 有 解决 办 法 。 

一 种 经 典 的 做 法 就 是 分 离 链 接 。 当 冲突 发 生 时 , 我 们 不 是 将 值 放 到 格子 里 ， 而 是 放 到 该 格子 
所 关联 的 数组 里 。 

现在 仔细 观察 该 散 列表 的 冲突 位 置 。 





























"taxi’" "evil’" 

















5D 6 7 8 9 
因为 要 放 入 "pat" 的 第 8 格 , 已 经 存在 "evil" 了 ， 于 是 我 们 将 第 8 格 的 内 容 换 成 一 个 数组 。 
该 数组 又 以 子 数组 构成 每 个 子 数组 含 两 个 元 素 , 第 一 个 是 被 检索 的 词 ， 后 一 个 是 其 相应 的 
同义词 。 






































"bad" |"evil"||ll "gab" | "pat" 












































7 8 9 
下 面 运行 一 遍 "dab" 的 查找 过 程 ， 执 行 : 





thesaurus["dab"] 
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计算 机 就 会 按 如 下 步骤 执行 。 
(1) 计算 散 列 值 DAB=4x1x2=8。 
(2) 读 取 第 8 格 ， 发 现 其 中 不 是 一 个 单独 的 值 ， 而 是 一 个 数组 。 


(3) 于 是 线性 地 在 该 数组 中 查找 ， 检 查 每 个 子 数组 的 索引 0 位置， 如 果 碰 到 要 找 的 词 ("dab" )， 
就 返回 该 子 数 组 的 索引 1 的 值 。 


再 图 形 化 地 演示 一 次 。 
求 得 DAB 的 散 列 值 为 8 ， 于 是 计算 机 读 取 第 8 格 。 
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"pad" |"evil"||| "gab" | "pat" 
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因为 第 8 格 里 面 是 一 个 数组 , 所 以 对 该 数组 进行 线性 查找 。 首先 是 第 1 格 , 它 又 是 一 个 数组 ， 
于 是 查看 这 个 子 数 组 的 索引 0。 





























"bad" |revil"|l| "dab" | "pat" 
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它 并 非 我 们 要 找 的 词 ("dab" )， 于 是 跳 到 下 一 格 。 
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这 一 格 的 子 数组 的 索引 0 正 是 "dab"， 因 此 其 索引 1 的 值 就 是 我 们 要 找 的 同义词 ( "pat" )。 


若 散 列表 的 格子 含有 数组 ， 因 为 要 在 这 些 数组 上 做 线性 查找 ， 所 以 步 数 会 多 于 1。 如 果 数 据 
都 刚好 存在 同一 个 格子 里 ,那么 查找 就 相当 于 在 数组 上 进行 。 因 此 散 列 表 的 最 坏 情 况 就 是 O(N)。 


为 了 避免 这 种 情况 ， 散 列表 的 设计 应 该 尽量 减少 冲突 ， 以 便 查找 都 能 以 O(1) 完 成 。 
接着 ， 我 们 就 来 看 一 下 现实 中 的 散 列表 是 如 何 做 到 的 。 
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7.5 “找到 平衡 

归根 到 底 ， 散 列表 的 效率 取决 于 以 下 因素 。 
口 要 存 多 少数 据 。 
口 有 多 少 可 用 的 格子 。 
口 用 什么 样 的 散 列 函数 。 

前 两 点 很 明显 。 如 果 要 放 的 数据 很 多 ， 格 子 却 很 少 ， 就 会 造成 大 量 冲 突 ， 导 致 效率 降低 。 但 
为 什么 和 散 列 函数 本 身 也 有 关系 呢 ? 我 们 这 就 来 看 看 。 

假设 你 准备 用 一 个 散 列 值 总 是 落 在 1 至 9 之 间 的 散 列 函数 ， 例 如 ， 将 字母 转 成 其 对 应 的 序号 ， 
然后 一 直 相 加 ， 直 至 结果 只 剩 一 位 数字 的 函数 。 

就 像 这 样 : 

PUT = 16 + 21 + 20 = 57 

因为 57 不 止 一 位 数字 ， 于 是 将 57 拆 成 5+7。 

5+7= 12 

12 也 不 止 一 位 数字 ， 于 是 拆 成 1 + 2。 

A 


最 终 ，PUT 的 散 列 值 为 3。 因 为 这 种 计算 逻辑 ， 该 散 列 函 数 只 会 返回 1 到 9 的 数字 。 
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再 回 到 散 列表 的 样子 。 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 

如 果 是 用 刚才 的 散 列 函数 , 那么 该 散 列 表 的 10 到 16 号 格子 就 都 用 不 上 了 ,数据 只 会 被 放 到 
1 到 9 的 格子 里 。 

所 以 ， 一 个 好 的 散 列 函数 ， 应 当 能 将 数据 分 散 到 所 有 可 用 的 格子 里 去 。 

如 果 一 个 散 列 表 只 需要 保存 5 个 值 ， 那 么 它 应 该 多 大 ， 以 及 采用 什么 散 列 函数 呢 ? 

要 是 散 列 表 只 有 5 个 格子 ,那么 散 列 函数 需要 算出 1 到 5 的 散 列 值 。 但 就 算 我 们 想 保 存 的 值 
也 只 有 5 个， 冲突 还 是 很 可 能 发 生 ， 因 为 散 列 值 只 有 5 种 可 能 。 

然而 ， 如 果 散 列表 有 100 个 格子 ， 散 列 函 数 的 结果 为 1 到 100 之 间 的 数 ， 存 5 个 值 进去 时 发 
生 冲 突 的 可 能 性 就 小 得 多 ， 因 为 落 入 的 格子 有 100 种 可 能 。 

尽管 100 个 格子 能 很 好 地 避免 冲突 ， 但 只 用 来 放 5 个 值 的 话 ， 就 太 浪 费 空间 了 。 

这 就 是 使 用 散 列表 时 所 需要 权衡 的 ， 既 要 避免 冲突 ， 又 要 节约 空间 。 

要 想 解 决 这 个 问题 ， 可 参考 计算 机 科学 家 研究 出 的 黄金 法 则 : 每 增加 7 个 元 素 ， 就 增加 10 
个 格子 。 

如 果 要 保存 14 个 元 素 ， 那 就 得 准备 20 个 格子 ， 以 此 类 推 。 

数据 量 与 格子 数 的 比值 称 为 负载 因子 。 把 这 个 术语 代入 刚才 的 理论 , 就是: 理想 的 负载 因子 
是 0.7 (7 个 元 素 /10 个 格子 )。 

如 果 你 一 开始 就 将 7 个 元 素 放 进 散 列 表 ， 那 么 计算 机 应 该 会 创建 出 一 个 含有 10 个 格子 的 散 
列表 。 随 着 你 添加 元 素 , 计算 机 也 会 添加 更 多 的 格子 来 扩展 这 个 散 列表 ， 并 改变 散 列 函数 ,使 新 
数据 能 均匀 地 分 布 到 新 的 格子 里 去 。 

幸运 的 是 , 一 般 编 程 语言 都 自 带 散 列 表 的 管理 机 制 ， 它 会 帮 你 决定 散 列 表 的 大 小 、 散 列 函 数 
的 逻辑 以 及 扩展 的 时 机 。 既然 你 已 经 理解 了 散 列 表 的 原理 , 那么 在 处 理 一 些 问 题 时 你 就 可 以 用 它 
取代 数组 ， 利 用 其 0(1) 的 查找 速度 来 提升 代码 性 能 。 







































































7.6 一 个 实例 


散 列表 有 各 种 用 途 ， 但 目前 我 们 只 考虑 用 它 来 提高 算法 速度 。 


第 1 章 我 们 学 习 了 基于 数组 的 集合 一 一 一 种 能 保证 元 素 不 重复 的 数组 。 每 次 往 其 中 插入 新 元 
素 时 ， 都 要 先 做 一 次 线性 查找 来 确定 该 元 素 是 否 已 存在 ( 如果 是 无 序数 组 )。 
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如 果 要 在 一 个 大 集合 上 进行 多 次 插入 ， 效 率 将 会 下 降 得 很 快 ， 因 为 每 次 插 和 人 都 需要 O(N)。 
很 多 时 候 ， 我 们 都 可 以 把 散 列 表 当 成 集合 来 用 。 
把 数组 作为 集合 的 话 ， 数 据 是 直接 放 到 格子 里 的 。 用 散 列 表 时 ， 则 是 将 数据 作为 键 , 值 可 以 
为 任何 形式 ， 例 如 数字 1， 或 者 布尔 值 true 也 行 。 
假设 在 Javascript 里 建立 了 如 下 所 示 的 散 列 表 。 
var set = {}; 
并 加 入 一 些 数据 。 
tbe = 1; 


set["banana"] = 1; 
set["cucumber"] = 1; 


这 样 每 次 插入 新 值 ， 都 只 需 花 0(1) 的 时 间 ， 而 不 是 线性 查找 的 O(N)。 即 使 数据 已 存在 时 也 


是 这 个 速度 。 















































set["banana"] = 1; 
再 次 插入 "banana" 时 ， 我 们 并 不 需要 检查 它 存 在 与 否 ， 因 为 即使 存在 ， 也 只 是 将 其 对 应 的 
值 重 写成 1。 
散 列表 确实 非常 适用 于 检查 数据 的 存在 性 。 第 4 章 我 们 讨论 过 如 何在 Javascript 里 检查 一 个 
数组 有 没有 重复 数据 。 一 开始 的 方案 如 下 所 示 。 
function hasDuplicateValue(array) { 
for(var i = 0; i < array.length; i++) { 
for(var j = 0; j < array.length; j++) { 


if(i !== j && array[i] == array[j]) { 
return true; 























} 
} 


return false; 


} 
当时 我 们 说 了 ， 该 般 套 循环 的 效率 是 O(N )。 
于 是 有 了 第 二 个 O(N) 的 方案 , 不 过 它 只 能 处 理 数据 全 为 非 负 整数 的 数组 。 如 果 数 组 含有 其 他 
东西 ， 例 如 字符 串 ， 那 怎么 办 呢 ? 
使 用 类 似 的 逻辑 ， 但 换 成 散 列 表 (在 Javascript 里 叫 作 对 象 )， 就 可 以 处 理 字符 串 了 。 


function hasDuplicateValue(array) { 
var existingValues = {}; 
for(var i = 0; i < array.length; i++) { 
if(existingValues[array[i]] === undefined) { 
existingValues[array[i]] = 1; 
} elsef{ 
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return true; 
} 
3 


return false; 





这 种 方法 也 是 O(N)， 其 中 的 existingValues 不 是 数组 而 是 散 列 表 ， 用 字符 串 作 为 键 ( 索 
引 ) 是 没有 问题 的 。 


假设 我 们 要 做 一 个 电子 投票 机 ,投票 者 可 以 投 给 现 有 的 候选 人 ,也 可 以 推荐 新 的 候选 人 。 因 
为 会 在 选举 的 最 后 统计 票数 ， 我 们 可 以 将 票 保存 在 一 个 数组 里 ， 每 投 一 票 就 将 其 插入 到 末尾 。 


var votes = []; 





function addVote(candidate) { 
votes.push(candidate); 


} 
最 终 数组 就 会 变 得 很 长 。 
["Thomas Jefferson", "John Adams", "John Adams", "Thomas Jefferson", "John Adams", ...] 


这 样 插入 很 快 ， 只 有 0(1)。 


那 点 票 的 效率 又 如 何 呢 ? 因为 票 都 在 数组 里 ,所 以 我 们 会 用 循环 来 遍历 它们 , 并 用 一 个 散 列 
表 来 记录 每 人 的 村 


function countVotes(votes) { 
var tally = {}; 
for(var i = 0; i < votes.Length; i++) { 
if(tally[votes[i]]) { 
tally[votes[i]]++; 
} else{ 
tally[votes[i]] = 
} 
} 








return tally; 
} 


过 这 样 需要 O(N)， 也 太 慢 了 
不 如 换 种 方式 ， 一 开始 就 用 散 列 表 来 收集 票 交 


Var votes = {}; 


function addVote(candidate) { 
if(votes[candidate]) { 
votes[candidatel]++; 
} eLse { 
votes[candidate] = 
} 
} 
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小 





function countVotes() { 
return votes ; 


} 
这 样 一 来 ， 投 票 是 O(1)， 并 且 因 为 投票 时 就 已 经 在 计数 ， 所 以 已 完成 了 点 票 的 步骤 。 

















7.7 总 结 


高 效 的 软件 离 不 开 散 列表 ， 因 为 其 0(1) 的 读 取 和 搬入 带 来 了 无 与 伦比 的 性 能 优势 。 


到 现在 为 止 , 我 们 探讨 各 种 数据 结构 时 都 只 考虑 了 性 能 。 但 你 知道 有 些 数据 结构 的 优点 并 不 
在 于 性 能 吗 ? 下 一 章 就 研究 两 种 能 帮助 改善 代码 可 读 性 和 可 维护 性 的 数据 结构 。 
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握 





迄今 为 止 , 我 们 对 数据 结构 的 讨论 都 集中 于 它们 在 各 种 操作 上 表现 出 的 性 能 。 但 其 实 ， 
多 种 数据 结构 还 有 助 于 简化 代码 ， 提 高 可 读 性 。 

本 章 你 将 会 学 习 两 种 新 的 数据 结构 : 栈 和 队列 。 事实 上 它们 并 不 是 全 新 的 东西 ， 只 不 过 是 多 
加 了 一 些 约束 条 件 的 数组 而 已 。 但 正 是 这 些 约束 条 件 为 它们 赋予 了 巧妙 的 用 法 。 

具体 一 点 说 , 栈 和 队列 都 是 处 理 临时 数据 的 灵活 工具 。 在 操作 系统 、 打 印 任务 、 数 据 遍 历 等 
各 种 需要 临时 容器 才能 构造 出 美妙 算法 的 场景 ， 它 们 都 大 有 作为 。 

处 理 临 时 数据 就 像 是 点 餐 。 在 菜 做 好 并 送 到 客人 手 上 之 前 ,订单 是 有 用 的 , 但 过 后 ， 你 无 须 
保留 那 张 订单 。 临 时 数据 就 是 一 些 处 理 完 便 不 再 有 用 的 信息 ， 因 此 没有 保留 的 必要 。 此 外 ， 就 像 
出 菜 时 应 先 出 给 早 下 单 的 客人 , 你 可 能 还 得 注意 数据 按 什么 顺序 去 处 理 。 栈 和 队列 就 正好 能 把 数 
据 按 顺序 处 理 ， 并 在 处 理 完成 后 将 其 抛弃 。 















































8.1 栈 

栈 存储 数据 的 方式 跟 数组 一 样 ， 都 是 将 元 素 排 成 一 行 。 只 不 过 它 还 有 以 下 3 条 约束 。 
口 只 能 在 末尾 插入 数据 。 
口 只 能 读 取 末尾 的 数据 。 
口 只 能 移 除 末尾 的 数据 。 
你 可 以 将 栈 看 成 一 有 到 碟子 : 你 只 能 看 到 最 顶端 那 只 碟子 的 碟 面 ， 其 他 都 看 不 到 。 男 外 ， 要 加 
碟子 只 能 往 上 加 , 不 能 往 中 间 塞 ,要 拿 碟子 只 能 从 上 面 拿 , 不 能 从 中 间 拿 ( 至 少 你 不 应 该 这 么 做 )。 
绝 大 部 分 计算 机 科学 家 都 把 栈 的 末尾 称 为 栈 顶 ， 把 栈 的 开头 称 为 栈 底 。 

尽管 这 些 约束 看 上 去 令 人 很 拘束 ， 但 很 快 你 就 会 发 现 它们 种 来 的 好 处 。 

我 们 先 从 一 个 空 栈 开始 演示 。 
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首先 , 将 5 压 入 栈 中 。 





+ 


5| 





这 没什么 特别 的 ， 就 如 往 数组 插入 数据 一 样 平 常 。 


接着 , 将 3 压 入 栈 中 。 

















再 将 0 压 入 栈 中 。 























注意 ， 每 次 压 栈 都 是 把 数据 加 到 








+ 


S| .3 0 








往 栈 里 插入 数据 ， 也 叫 作 压 栈 。 你 可 以 想象 把 一 个 碟子 压 在 其 他 碟子 上 的 画面 。 





I 栈 顶 (也 就 是 栈 的 末尾 )。 如 果 想 把 0 所 





那 是 不 允许 的 ， 因 为 这 就 是 栈 的 特性 


生 : 只 能 在 末尾 插入 数据 。 


从 栈 顶 移 除 数据 叫 作 出 栈 。 这 也 是 栈 的 限制 : 只 能 移 除 未 尾 的 数据 。 














来 把 栈 中 的 一 些 数据 弹出 。 
首先 ， 弹 出 0。 




















现在 剩 下 两 个 元 素 ，$ 和 3。 
接着 ， 弹 出 3。 


这 就 利 F5 了 。 





四 


3 


四 


入 到 栈 底 或 中 间 ， 
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压 栈 和 出 栈 可 被 形容 为 LIFO ( last in，first out ) 后 进 先 出 。 解 释 起 来 就 是 最 后 入 栈 的 元 素 ， 
会 最 先 出 栈 。 就 像 无 心 向 学 的 学 生 ， 最 迟到 校 的 总 是 他 ， 最 早 回 家 的 也 是 他 。 











8.2 ” 栈 实战 


栈 很 少 用 于 需要 长 期 保留 数据 的 场景 ， 却 常用 于 各 种 处 理 临 时 数据 的 算法 。 


下 面 我 们 来 写 一 个 初级 的 JavaScript 分 析 需 一 一 一 种 用 来 检查 JavaScript 代码 的 语法 是 否 正 
确 的 工具 。 因 为 JavaScript 的 语法 规则 很 多 ， 所 以 它 可 以 做 得 很 复杂 。 简 单 起 见 ， 我 们 就 只 专注 
于 检查 括号 的 闭合 情况 吧 ， 包 括 圆 括号 、 方 括号 、 花 括号 ， 这 些 地 方 搞 错 的 话 是 很 邻 人 郁闷 的 。 


在 写 之 前 ， 先 分 析 一 下 括号 的 语法 错误 会 有 哪些 情况 。 分 类 就 是 以 下 3 种 。 
首先 是 有 左 括号 没有 右 括号 的 情况 。 


(var x = 2; 
这 种 归 为 第 1 类 。 
接着 是 没有 左 括号 但 有 右 括号 的 情况 。 



























































var x = 2;) 

这 种 归 为 第 2 类 。 
还 有 第 3 类 ， 右 括号 类 型 与 其 前 面 最 近 的 左 括号 不 匹配 ， 例 如 : 
(var x = [1, 2, 3)]; 
































此 例 中 ， 虽 然 圆 括号 和 方 括号 都 左右 成 对 出 现 ， 但 位 置 不 对 ， 右 圆 括号 前 面 最 近 的 竞 是 左 方 括号 。 
那么 怎样 才能 实现 一 种 能 检查 一 行 代 码 里 括号 写 得 对 不 对 的 算法 呢 ? 用 栈 就 好 办 了 。 
先 准备 一 个 空 栈 ， 然 后 从 左 至 右 读 取代 码 的 每 一 个 字符 ， 并 执行 以 下 规则 。 
(1) 如 果 读 到 的 字符 不 是 任 一 种 括号 〈 圆 括号 、 方 括号 、 花 括号 )， 就 忽略 它 ， 继 续 下 一 个 。 
(2) 如 果 读 到 左 括号 ， 就 将 其 压 和 人 栈 中 ， 意 味 着 后 面 需要 有 对 应 的 右 括号 来 做 闭合 。 
(3) 如 果 读 到 右 括号 ， 就 查看 栈 顶 的 元 素 ， 并 做 如 下 分 析 。 


到 如 果 栈 里 没有 任何 元 素 ， 也 就 是 遇 到 了 右 括号 但 没有 左 括号 ， 即 第 2 类 语法 错误 。 

a 如 果 栈 里 有 数据 ， 但 与 刚才 读 到 的 右 括号 类 型 不 匹配 ， 那 就 是 第 3 类 语法 错误 。 

m 如 果 栈 项 元 素 是 匹配 的 左 括 号 ， 则 表示 它 已 经 闭合 。 那 么 就 可 以 将 其 弹出 ， 因 为 已 经 
不 需要 再 记 住 它 了 。 


(4) 如 果 一 行 代码 读 完 ， 栈 里 还 留 有 数据 ， 那 就 表示 存在 左 括号 ， 没 有 右 括号 与 之 匹配 ， 即 
第 1 类 语法 错误 。 
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让 我 们 用 以 下 代码 作为 例子 来 演示 一 遍 。 

(var x = {y: [1, 2, 31}) 
备 好 一 个 空 栈 之 后 ， 就 可 以 开始 从 左 至 右 读 取代 码 的 每 个 字符 了 。 
第 1 步 : 首先 是 第 一 个 字符 ， 它 是 一 个 左 圆 括号 。 


y 
(var x = {y: [1, 2, 3]}) 


第 2 步 : 因为 它 是 一 个 左 括号 ， 所 以 将 其 压 入 栈 中 。 

+ 

四 

接 下 来 的 var x =， 没 有 一 个 是 括号 ， 因 此 会 被 忽略 。 
第 3 步 : 遇 到 一 个 左 花 括号 。 



































y 
(var x = {y: [1, 2, 3]}) 


第 4 步 : 将 其 压 人 栈 中 。 
M 


(|{ 





然后 忽略 y:。 
第 5 步 : 遇 到 一 个 左 方 括号 。 


y 
(var x = {y: [1, 2, 3]}) 


第 6 步 : 同样 把 它 压 入 栈 中 。 





+ 
CIE 











然后 忽略 1，2，3。 
第 7 步 : 这 时 我 们 第 一 次 看 到 了 右 括号 ， 是 一 个 右 方 括号 。 


y 
(var x = {y: [1, 2, 3]}) 








第 8 步 : 于 是 检查 栈 顶 的 元 素 , 发 现 那 是 一 个 左 方 括号 。 因 为 刚才 读 到 的 右 方 括号 能 与 其 配 
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对 ， 所 以 将 左 方 括号 弹出 。 





Ms 





(|{ 














第 9 步 : 继续 ， 下 一 个 读 到 的 是 右 花 括号 。 





y 
(var x = {y: [1, 2, 3]}) 





第 10 步 : 检查 栈 里 的 最 后 一 个 元 素 ， 刚 好 是 可 以 配对 的 左 花 括号 。 于 是 将 其 弹出 。 


(| 











第 11 步 : 读 到 一 个 右 圆 括号 。 


y 
(var x = {y: [1, 2, 3]}) 

















第 12 步 : 检查 栈 里 的 最 后 一 个 元 素 ， 刚 好 是 可 以 配对 的 左 圆 括号 。 于 是 将 其 弹出 ， 剩 下 一 
个 空 栈 。 
至 此 ,代码 读 完 了 ， 栈 也 空 着 ， 所 以 我 们 的 分 析 器 可 以 定论 ,这 段 代 码 在 括号 方面 没有 语法 
错误 。 
以 下 是 上 述 算法 的 Ruby 实现 。Ruby 的 数组 自 带 push 和 pop 方法 ， 是 在 数组 结尾 插入 和 删 
除 元 素 的 便捷 调用 。 只 使 用 这 两 个 方法 的 话 ， 数 组 便 形 同 于 栈 。 


class Linter 

















attr_reader :error 


def initialize 
# 用 一 个 普通 的 数组 来 当 作 栈 
@stack = [] 

end 


def lint(text) 
# 循环 读 取 文 本 的 每 个 字符 
text.each char.with index do |char, index| 


if opening brace?(char) 
# 如 果 读 到 左 括号 ， 则 将 其 压 入 栈 中 


@stack.push(char) 
elsif closing brace?(char) 
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if closes most recent _ opening brace?(char) 
# 如 果 读 到 右 括号 ， 并 且 它 与 栈 顶 的 左 括号 匹配 ， 
人 ## 则 将 栈 项 弹出 
@stack.pop 





else # 如 果 读 到 右 括 号 ， 但 它 与 栈 顶 的 左 括号 不 匹配 


GQerror = "Incorrect closing brace: #{char} at index #{index}" 
return 
end 
end 
end 


if @stack.any? 


# 如 果 读 完 所 有 字符 后 栈 不 为 空 ， 就 表示 文中 存在 着 没有 相应 右 括 号 的 左 括号 
Gerror = "#{@stack.last} does not have a closing brace" 
end 
end 


private 


def opening brace?(char) 
["(", "[", "{"].include?(char) 
end 


def closing brace?(char) 
[")", "]", "}"].include?(char) 
end 


def opening brace of(char) 
{0)" => ,> ,> "{"} [char] 
end 





def most recent opening brace 
@stack. last 
end 


def closes most recent opening brace?(char) 
opening brace of(char) == most recent opening brace 
end 
end 


如 果 这 样 使 用 的 话 : 


linter = Linter.new 
linter.lint("( var x= {y: [1, 2, 3] } )") 
puts linter.error 


因为 该 段 代码 语法 正确 ， 所 以 不 会 有 错误 信息 打印 出 来 。 然 而 ， 要 是 不 小 心 调 转 了 最 后 两 个 字符 : 


linter = Linter.new 
linter.lint("( var x= {y: [1, 2, 3] ) }") 
puts linter.error 


就 会 出 现 以 下 信息 。 
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Incorrect closing brace: ) at index 25 


如 果 丢 掉 最 后 那个 右 括 号 : 


Linter = Linter.new 
linter.lint("( var x= { y: [1, 2, 3] }") 
puts linter.error 


就 会 出 现 如 下 的 报错 。 

( does not have a closing brace 

在 刚才 的 例子 中 , 栈 被 巧妙 地 用 来 跟踪 那些 还 没有 配对 的 左 括号 。 到 了 下 一 章 , 我 们 会 类 似 
地 用 栈 去 跟踪 函数 的 调用 ， 那 也 是 递归 的 核心 思想 。 

当 数 据 的 处 理 顺序 要 与 接收 顺序 相反 时 ( LIFO )， 用 栈 就 对 了 。 像 文字 处 理 器 的 “撤销 ” 动 
作 ， 或 网 络 应 用 程序 的 函数 调用 ， 你 应 该 都 会 需要 栈 来 实现 。 














8.3 队列 

队列 对 于 临时 数据 的 处 理 也 十 分 有 趣 , 它 跟 栈 一 样 都 是 有 约束 条 件 的 数组 。 区 别 在 于 我 们 想 
要 按 什么 顺序 去 处 理 数据 ， 而 这 个 顺序 当然 是 要 取决 于 具体 的 应 用 场景 。 

你 可 以 将 队列 想象 成 是 电影 院 排队 。 排 在 最 前 面 的 人 会 最 先 离队 进入 影院 。 套 用 到 队列 上 ， 
就 是 首先 加 入 队列 的 , 将 会 首先 从 队列 移出 。 因 此 计算 机 科学 家 都 用 缩写 “FIFO”( first in, first out ) Lm 
先进 先 出 ， 来 形容 它 。 

与 栈 类 似 ， 队 列 也 有 3 个 限制 (但 内 容 不 同 )。 
口 只 能 在 末尾 插入 数据 ( 这 跟 栈 一 样 )。 
区 开头 的 数据 ( 这 跟 栈 相反 )。 
bE 移 除 开头 的 数据 ( 这 也 跟 栈 相反 )。 

下 面 来 看 看 它 是 怎么 运作 的 ， 先 准备 一 个 空 队列 。 

首先 , 插入 $ (虽然 栈 的 插入 就 叫 压 栈 , 但 队列 的 插入 却 没 有 固定 的 叫 法 , 一般 可 以 叫 放 入 、 
加 入 、 入 队 )。 

































































Tm TD 
Et 
米 
YI 








然后 ,插入 9。 
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接着 ,插入 100。 

















目前 为 止 ， 队 列表 现 得 还 跟 栈 一 样 ,但 要 是 移 除数 据 的 话 ， 就 会 跟 栈 反 着 来 了 ， 因 为 队列 是 
从 开头 移 除 数据 的 。 


想 移 除数 据 ， 得 先 从 5 开始 ， 因 为 开头 就 是 它 。 


| 100 
5 





接着 ， 移 除 9。 


(O | < 
忆 
© 
© 





这 样 一 来 ， 队 列 就 只 剩 下 100 了 。 





8.4 队列 实战 


队列 应 用 广泛 ， 从 打印 机 的 作业 设置 ， 到 网 络 应 用 程序 的 后 台 任务 ， 都 有 队列 的 存在 。 


假设 你 正在 用 Ruby 编写 一 个 简单 的 打印 机 接口 ， 以 接收 网 络 上 不 同 计算 机 的 打印 任务 。 利 
用 Ruby 数组 的 push 方法 ， 将 数据 加 到 数组 未 尾 ， 以 及 shift 方法 ， 将 数据 从 数组 开头 移 除 。 
你 可 以 这 样 来 编写 接口 类 。 


class PrintManager 























def initialize 
Gqueue = [] 
end 


def queue print job(document) 
@queue.push(document) 
end 


def run 
while @queue.any? 
# Ruby 的 shift 方法 可 移出 并 返回 数组 的 第 一 个 元 素 
print(@queue. shift) 
end 


Ck 
Dg 
了 
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end 
private 


def print(document) 
## 让 打印 机 去 打印 文档 (为 了 演示 ， 暂 时 先 打 到 终端 上 ) 
puts document 

end 


end 
然后 这 样 使 用 它 。 


print manager = PrintManager.new 

print manager.queue print job("First Document") 
print manager.queue print job("Second Document") 
print manager.queue print job("Third Document") 
print manager.run 


接着 打印 机 就 会 按 3 份 文档 的 接收 顺序 来 把 它们 打印 出 来 。 














First Document 
Second Document 
Third Document 


尽管 这 个 例子 把 打印 机 的 工作 方式 写 得 很 抽象 , 简化 了 细节 , 但 其 中 对 队列 基本 用 法 的 描述 
是 真实 的 ， 以 此 为 基础 去 构建 真正 的 打印 系统 是 可 行 的 。 

队列 也 是 处 理 异 步 请 求 的 理想 工具 一 一 它 能 保证 请 求 按 接收 的 顺序 来 执行 。 此 外 , 它 也 常用 
于 模拟 现实 世界 中 需要 有 序 处 理事 情 的 场景 ， 例 如 飞机 排队 起 飞 、 病 人 排队 看 医生 。 











8.5 总 结 


如 你 所 见 ， 栈 和 队列 是 能 巧妙 解决 各 种 现实 问题 的 编程 工具 。 


掌握 了 栈 和 队列 ， 就 解锁 出 了 下 一 个 目标 : 学 习 基 于 栈 的 递归 。 递 归 也 是 其 他 高 级 算法 的 基 
础 ， 我 们 将 会 在 本 书 余 下 的 部 分 讲解 它们 。 























过 归 











在 学 习 本 书 其 余 算 法 之 前 , 你 得 先 学 会 递归 。 解决 很 多 看 似 复 杂 的 问题 时 ， 如果 从 递归 的 角 
度 去 思考 ， 会 出 人 意料 地 简单 ， 而 且 代 码 量 还 会 大 大 减少 。 

不 过 ， 我 们 先 做 一 个 突击 测试 ! 

运行 一 个 定义 如 下 的 btah() 函数 ， 会 发 后 什么 ? 

function blah() { 

blah(); 

} 

正如 你 所 想 的 ，blah() 会 调用 blah()， 后 者 也 会 调用 blah () ， 于 是 就 这 样 无 限 地 调用 
下 去 。 


函数 调用 自身 ， 就 叫 作 递归 。 无 限 递归 用 处 不 大 ， 其 至 还 挺 危险 ， 但 是 有 限 的 递归 很 强大 。 
掌控 好 递归 能 帮助 我 们 解决 某 些 棘手 的 问题 ， 我 很 快 就 会 证 明 给 你 看 。 























9.1 用 递归 代替 循环 


假设 在 NASA 工作 的 你 ， 需 要 写 一 个 用 于 发 射 飞 船 的 倒数 程序 。 该 程序 接收 一 个 数字 ， 例 
如 10， 然 后 显示 从 10 到 0 的 数字 。 现 在 先 暂 停 一 下 ， 选 择 一 门 编程 语言 来 实现 这 个 程序 ， 做 完 
以 后 ， 再 往 下 阅读 。 

或 许 你 用 了 JavaScript， 并 且 写 了 如 下 循环 。 

function countdown(number) { 


for(var i = number; i >= 0; i--) { 
console.log(i); 









































countdown (10); 
这 样 写 没什么 问题 ， 只 是 你 可 能 没 想到 循环 以 外 的 做 法 。 


那 还 能 怎么 做 呢 ? 
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试 试 换 成 递归 吧 。 以 下 是 初级 版 的 递归 countdown。 


function countdown(number) { 
console.log(number); 
countdown(number - 1) 


} 


countdown (10) 
让 我 们 一 步 步 来 分 析 。 
调用 countdown (10) ， 因 此 参数 number 为 10。 
2 步 : 将 number ( 值 为 10) 打印 到 控制 台 。 
countdown 函数 在 结束 前 ， 调 用 了 countdown(9) (因为 number - 1 等 于 9)。 
名 4 步 : countdown(9) 被 执行 ， 会 将 number ( 值 为 9 ) 打印 到 控制 台 。 
和 5 步 : countdown (9) 结 束 前 ， 调 用 了 countdown (8)。 
第 6 步 : countdown(8) 被 执行 ， 会 将 number ( 值 为 8 ) 打印 到 控制 台 。 
在 继续 步 又 分 解 之 前 , 先 回顾 下 该 递归 是 怎样 实现 我 们 的 需求 的 。countdown 里 并 没有 任何 
循环 结构 ， 它 通过 调用 自身 就 能 够 从 10 开始 倒数 并 将 每 个 数字 打印 出 来 。 
几乎 所 有 循环 都 能 够 转换 成 递归 。 但 能 用 不 代表 该 用 。 递 归 的 强项 在 于 巧妙 地 解决 问题 ,但 
在 上 面 的 例子 中 , 它 并 不 比 普通 的 循环 更 加 优雅 、 高 效 。 我 们 很 快 就 会 看 到 能 让 递归 发 挥 威力 的 
场景 ， 但 在 那 之 前 ， 还 是 先 理 清 递 归 的 运作 方式 。 


说 
At 
i 
Ns 


du 








Ni NR NR WR 
ray 
(LD 
由 
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让 我 们 把 countdown 函数 继续 下 去 。 为 了 简洁 一 点 ， 我 们 跳 过 一 些 步 又 。 
第 21 步 : 调用 countdown(0)。 
第 22 步 : 将 number ( 值 为 0) 打印 到 控制 台 。 
第 23 步 : 调用 countdown(-1)。 
第 24 步 : 将 number ( 值 为 -1 ) 打印 到 控制 台 。 
炎 了 ,你 也 看 到 了 ， 这 种 写法 不 够 完善 ， 这 样 下 去 我 们 就 会 不 断 地 打印 负数 。 
要 解决 这 个 问题 ， 得 在 数 到 0 时 就 停 住 ， 以 免 递 归 一 直 往 下 数 。 
我 们 可 以 加 个 条 件 判断 ， 来 保证 当 number 为 0 时 ， 不 再 调用 countdown () 。 


function countdown(number) { 
console. log(number); 
if(number === 0) { 
return; 
} eLse { 
countdown(number - 1); 
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} 
countdown(10); 
这 样 ， 当 number 为 0 时 ,我 们 的 代码 就 不 会 再 去 调用 countdown ( ) ， 而 是 直接 返回 。 


在 递归 领域 (真有 这 么 一 个 地 方 ), 不 再 递归 的 情形 称 为 基准 情形 。 对 于 刚才 的 countdown () 函 
数 来 说 ，0 就 是 基准 情形 。 





9.3 阅读 递归 代码 


递归 是 需要 时 间 和 练习 才能 适应 的 ， 到 那 时 候 , 你 会 掌握 两 种 技巧 : 阅读 递归 代码 和 编写 递 
归 代 码 。 阅 读 递归 代码 相对 简单 一 点 ， 所 以 就 完 从 这 里 入 手 吧 。 
我 们 会 以 阶乘 作为 例子 。 阶 乘 的 演示 如 下 所 示 。 
3 的 阶乘 是 : 
3*2*1=6 
5 的 阶乘 是 : 
5*4*3+*2+*1= 120 
以 此 类 推 。 以 下 Ruby 代码 会 以 递归 计算 的 方式 返回 一 个 数 的 阶乘 。 
def factorial (number) 
if number == 1 
return 1 
else 
return number * factorial(number - 1) 


end 
end 


此 代码 初 看 可 能 会 让 人 有 点 困惑 ， 可 以 按照 以 下 流程 来 读 。 
(D 找 出 基准 情形 。 

CO) 看 该 函数 在 基准 情形 下 会 做 什么 。 

G) 看 该 函数 在 到 达 基 准 情形 的 前 一 步 会 做 什么 。 

(4) 就 这 样 往 前 推 ， 看 每 一 步 都 在 做 什么 。 

让 我 们 将 此 流程 应 用 到 刚才 的 代码 上 。 稍 作 分 析 ， 就 可 以 看 出 里 面 有 两 条 路 径 。 
if number == 1 

交 


return number * factorial(number - 1) 
end 
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第 二 条 路 的 factorial 有 调用 自身 ， 是 递归 发 生 的 地 方 。 
else 


return number * factorial (number - 1) 
end 





re 


第 一 条 路 并 没有 调用 自身 ， 因 此 这 里 是 基准 情形 。 


if number == 1 
return 1 


于 是 ，number 为 1 时 ， 是 基准 情形 。 
接着 , 想象 factorial 方法 在 基准 情形 下 , 即 factorial(1) 的 处 理 流程 ,其 相关 代码 如 下 。 


上 o > 二、 


























if number == 1 
return 1 





好 ， 这 很 简单 ， 因 为 是 基准 情形 ， 所 以 没有 递归 。 调 用 factorial(1) 就 会 直接 返回 1。 
是 找 来 一 张 纸 ， 记 下 该 结果 。 























fac+orial (1) returns | 


然后 ， 回 到 上 一 步 的 factorial(2)， 相 关 代 码 如 下 。 





else 
return number * factorial(number - 1) 
end 
调用 factorial(2) 就 会 返回 2 * factorial(1)。 要 计算 2 * factorial(1)， 就 得 先知 

















道 factorial(1) 的 结果 。 要 是 检查 下 前 面 所 记 ， JR 1。 因 此 ，2 * 0 ) 
就 是 2 * 1， 即 是 2。 


把 这 个 也 记 到 纸 上 。 




















fac+orial (2) returns 2 
{actoral (1) returns | 


那么 ，factoriatL(3) 又 会 是 什么 呢 ? 再 回 看 代码 。 


else 


return number * factorial(number - 1) 
end 

















代入 参数 便 是 3 * factorial(2)。 那 么 factoriatL(2) 是 什么 呢 ? 你 不 用 从 头 计算 ， 因 为 


它 的 结果 已 经 写 在 纸 上 了 , 是 2。 factorial(3) 会 返回 6 (3*2=6)。 将 结果 记 下 ， 然 后 
继续 。 
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fac+orial (3) re+wrns 6 
fac+orial (2) returns 2 


factorial (1) returns | 
现在 请 自行 计算 factorial (4)。 
如 你 所 见 ， 这 种 从 基准 情形 入 手 再 往 上 分 析 的 思路 ， 对 理解 递归 代码 是 多 么 有 益 。 
事实 上 ， 此 方法 不 仅 为 人 类 所 利用 ,计算 机 也 差不多 是 这 样 做 的 。 下 面 就 来 看 看 。 





























9.4 计算 机 眼中 的 递归 


细 想 一 下 我 们 的 factorial 方法 ， 你 会 发 觉 当 factorial(3) 执 行 时 , 会 有 如 下 事情 发 生 


计算 机 调用 factorial(3)， We 调用 了 factorial(2), 而 在 factorial(2) 
返回 前 ， 又 调用 了 factorial(1)。 从 技术 上 来 说 ， 当 计算 机 执行 factorial(1) 时 ， 它 其 实 还 
在 factorial(2) 之 中 ， 和 ) 又 正在 factorial (3) 之 中 。 


计算 机 是 用 栈 来 记录 每 个 调用 中 的 函数 。 这 个 栈 就 叫 作 调用 栈 。 
让 我 们 以 factorial 为 例 来 观察 调用 栈 如 何 运 作 。 


起 初 计 算 机 调用 的 是 factoriaL(3) 。 然 而 , 在 该 方法 完成 之 前 ， 它 又 调用 了 factorial(2)。 
为 了 记 住 自己 还 在 factorial(3) 中 ,计算 机 将 此 事 压 入 调用 栈 中 。 


| 


ee factorial (2)。 该 factoriaL(2) 会 调用 factorial(1)。 不 过 在 进入 
factorial(1) 前 ,计算 机 得 记 住 自己 还 在 factoriaL(2) 中 ， 于 是 ， 它 将 此 事 也 压 


| 


ftac+orial (3) factonal (2) 
































然后 计算 机 执行 factorial (1)。 因 为 1 已 经 是 基准 情形 了 ， 所 以 它 可 以 返回 ,不 用 再 调用 


factoriatL。 


尽管 factorial(1) 结 束 了 , 但 调用 栈 内 仍 存 在 数据 ， 意 味 着 整 件 事 还 没完 ， 计算机 还 处 于 
其 他 函数 当中 。 0 栈 的 规定 是 只 有 栈 顶 元 素 ( 即 最 后 的 元 素 ) 才能 被 看 到 。 所 以 ， 
计算 机 接 下 来 就 去 检查 了 调用 栈 的 栈 项 ， 发 现 那 是 factorial(2)。 
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由 于 factorial(2) 是 调用 栈 的 最 后 一 项 ， 因 此 代表 最 近 调 用 并 且 最 应 该 先 完成 的 是 


factorial (2)。 


于 是 计算 机 将 factorial (2) 从 调用 栈 弹 出 。 


factorial (3) | 
factonal (2) 
并 将 其 结束 。 


然后 计算 机 再 次 检查 调用 栈 ， 看 下 一 步 应 该 结束 哪个 方法 。 调 用 栈 如 下 所 示 。 


于 是 计算 机 将 factorial (3) 从 调用 栈 弹 出 ， 并 将 其 结束 。 

到 这 里 ， 调 用 栈 就 清空 了 ,计算 机 也 因此 得 知 所 有 方法 都 执行 完了 ， 递归 结束 。 

从 更 高 的 角度 去 看 ， 可 以 看 出 计算 机 处 理 3 的 阶乘 时 ， 步 又 如 下 。 

(1) factorial(3) 被 第 一 个 调用 。 

(2) factorial(2) 被 第 二 个 调用 。 

(3) factorial(1) 被 第 三 个 调用 。 

(4) factorial(1) 被 第 一 个 完成 。 9 
(5) factorial(2) 在 factorial(1) 的 基础 上 完成 。 

(6) 最 后 ，factorial(3) 在 factorial(2) 的 基础 上 完成 。 


有 趣 的 是 ,无 限 递归 ( 如 本 章 开头 的 例子 ) 的 程序 会 一 直 将 同一 方法 加 到 调用 栈 上 ,直到 计 
算 机 的 内 存 空 间 不 足 ， 最 终 导致 栈 溢出 的 错误 。 





















































9.5 ”递归 实战 
虽然 上 面 的 NASA 倒数 程序 和 阶乘 计算 能 用 递归 来 解决 ， 但 用 普通 的 循环 来 做 也 不 难 。 除 
了 好 玩 以 外 ， 递 归 在 这 些 问题 上 没 体现 出 什么 优势 。 


事实 上 ,递归 可 以 自然 地 用 于 实现 那些 需要 重复 自身 的 算法 。 在 这 些 情况 下 ,递归 可 以 增强 
代码 的 可 读 性 ， 你 接 下 来 就 会 看 到 。 
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比如 说 遍历 文件 系统 。 假设 你 现在 要 写 一 个 脚本 , 它 用 于 对 一 个 目录 下 的 所 有 文件 进行 某 种 
操作 。 这 里 的 “所 有 文件 ”， 不 仅 指 的 是 该 目录 中 的 文件 ， 还 包括 其 子 目录 的 文件 ， 以 及 子 目 录 
里 的 子 目 录 的 文件 ， 以 此 类 推 。 


我 们 先 用 Ruby 写 一 个 打印 某 目 录 下 所 有 子 目 录 名 字 的 脚本 。 


def find directories(directory) 
Dir.foreach(directory) do |filenamel| 
if File.directory?( {drectory /et Erenanel ) && 











filename != "." && filename != " 
puts "#{directory}/#{filename}" 
end 
end 
end 


# 以 当前 目录 为 参数 ， 调 用 find_directories 
find directories(".") 


此 脚本 遍历 给 定 目录 下 的 所 有 文件 。 当 遇 到 的 某 个 文件 为 子 目录 时 ( 即 文件 类 型 为 目录 , 但 
又 不 是 代表 “当前 目录 “上 级 目录 ”的 句号 和 双人 句号 的 那些 文件 )， 将 其 名 字 打 印 出 来 。 


虽然 这 跑 起 来 没 问题 , 但 它 只 打印 了 当前 目录 的 直属 子 目 录 的 名 字 , 并 没有 打印 出 那些 子 目 
录 的 子 目录 的 名 字 。 


接着 我 们 改进 一 下 ,使 该 脚本 能 再 深入 到 下 一 层 目 录 。 


def find directories(directory) 
# 遍历 给 定 目录 下 的 文件 
Dir.foreach(directory) do |filenamel| 
if File.directory?(' #{directory}/#{ fvenaned ) && 
filename != "." && filename != " 
puts "#{directory}/#{filename}" 
# 遍历 其 子 目 录 下 的 文件 
Dir.foreach("#{directory}/#{filename}") do |inner filenamel| 
if File.directory?(" #0 ECTOrY /tL enane /ttnner, filename}") && 














inner filename != "." AR inner filename != " 
puts "#{directory}/#{filename}/#{inner filename}" 
end 
end 
end 
end 
end 


# 以 当前 目录 为 参数 ， 调 用 find_directories 
find directories(".") 























这 样 ,我 们 就 可 以 对 每 个 子 目 录 再 发 起 男 一 个 循环 去 遍历 其 中 的 孙子 目录 了 。 不 过 , 它 只 能 
进 到 两 层 目 录 的 深度 而 已 。 如 果 我 们 还 想 进 到 第 三 层 、 第 四 层 、 第 五 屋 ,甚至 最 底层 ， 那 要 怎么 








做 呢 ? 以 目前 的 思路 似乎 不 可 能 实现 。 
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站 














这 就 是 递归 出 马 的 时 候 了 。 使 用 递归 的 话 , 我们 可 以 写 一 


> 二 
汽 ! 


def find directories(directory) 
Dir.foreach(directory) do |filename| 


if File.directory?("#{directory}/#{filename}") && 
filename != "." AR filename != ".." 
puts "#{directory}/#{filename}" 


find directories("#{directory}/#{filename}") 
end 


end 
end 


# 以 当前 目录 为 参数 ， 调 用 find_directories 
find directories(".") 


find directories 会 


个 进入 任意 深 
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条 度 的 脚本 ， 而 且 很 简 





对 所 遇 到 的 每 个 子 目录 再 调用 find_directories。 这 样 一 来 ， 所 有 
子 目 录 都 会 被 控 出 来 ， 没 有 一 -1 


个 会 漏 掉 。 
此 算法 如 下 图 所 示 ， 其 中 的 号 码 代 表 目录 被 访问 的 顺 ) 














， 改 用 递归 并 不 会 改变 算法 的 大 0。 但 是 , 在 下 一 章 你 会 看 到 ,递归 可 以 作为 算法 的 核 
i ， 影 响 算法 的 速度 。 


9.6 总 结 


LN 


掌握 递归 ， 








正如 文件 系统 的 例子 所 示 ， 递 归 十 分 适用 于 那些 无 法 预 估计 算 深度 的 问题 。 


你 就 解锁 了 一 批 高 效 但 更 为 高 深 的 算法 。 它 们 都 离 不 开 递归 的 原理 。 





飞快 的 递归 算法 








递归 给 我 们 带 来 了 新 的 算法 实现 方式 ， 例 如 上 一 章 的 文件 系统 遍历 。 本 章 我 们 还 会 看 到 ， 
归 能 使 算法 效率 大 大 提高 。 

前 儿童 我 们 学 会 了 一 些 排序 算法 ,包括 冒 泡 排 序 、 选 择 排 序 和 插入 排序 。 但 在 现实 中 ,数组 
排序 不 是 通过 它们 来 做 的 。 为 了 免 去 大 家 重复 编写 排序 算法 的 烦恼 , 大 多 数 编程 语言 都 自 带 用 于 
数组 排序 的 函数 ， 其 中 很 多 采用 的 都 是 快速 排序 。 

虽然 它 已 经 实现 好 了 ，, 但 我 们 还 是 想 研 究 一 下 它 的 原理 , 因为 其 运用 递归 来 给 算法 提速 的 做 
法 极 具 推广 意义 。 

快速 排序 真 的 很 快 尽管 在 最 坏 情况 ( 数组 逆序 ) 下 它 跟 插入 排序 、 选 择 排序 的 效率 差不多 ， 
但 在 日 常 多 见 的 平均 情况 中 ， 它 的 确 表现 优异 。 

快速 排序 依赖 于 一 个 名 为 分 区 的 概念 ， 所 以 我 们 先 从 它 开始 了 解 。 
















































































10.1 分 区 


此 处 的 分 区 指 的 是 从 数组 随机 选取 一 个 值 ， 以 其 为 轴 , 将 比 它 小 的 值 放 到 它 左 边 ， 比 它 大 的 
值 放 到 它 右边 。 分 区 的 算法 实现 起 来 很 简单 ， 例 子 如 下 所 示 。 


假设 有 一 个 下 面 这 样 的 数组 。 


01512111613 


从 技术 上 来 说 ,选任 意 值 为 轴 都 可 以 , 我 们 就 以 数组 最 右 的 值 为 轴 吧 。 现 在 轴 就 是 3 了 , 我 


们 把 它 圈 起 来 。 
0151211]6]3 











然后 放置 指针 ， 它 们 应 该 分 别 指向 排除 轴 元 素 的 数组 最 左 和 最 右 的 元 素 。 


01512|1|6]3) 


w 


左 指针 右 指 针 





接着 就 可 以 分 区 了 ， 步 又 如 下 。 

(1) 左 指针 逐个 格子 向 右 移动 ， 当 直到 大 于 或 等 于 轴 的 值 时 ， 

(2) 右 指 针 逐 个 格子 向 左 移动 ， 当 遇 到 小 于 或 等 于 轴 的 值 时 ， 

(3) 将 两 指针 所 指 的 值 交 换 位 置 。 

(4) 重复 上 述 步 又 ， 直 至 两 指针 重合 ， 或 左 指针 移 到 右 指 针 的 右边 。 

(5) 将 轴 与 左 指针 所 指 的 值 交 换 位 置 。 

当 分 区 完成 时 ， 在 轴 左 侧 的 那些 值 肯定 比 轴 要 小 ， 在 轴 右 侧 的 那些 值 肯定 比 轴 要 大 。 因 此 ， 
轴 的 位 置 也 就 确定 了 ， 虽 然 其 他 值 的 位 置 还 没有 完全 确定 。 

让 我 们 来 把 此 流程 套 到 示例 数组 上 。 

第 1 步 : 拿 左 指针 ( 正 指向 0) 与 轴 ( 值 为 3) 比较 。 


01512|1|6]3) 


A ba 


左 指针 右 指 针 



































由 于 0 比 轴 小 ， 左 指针 可 以 右 移 。 


第 2 步 : 右 移 左 指针 。 
015|2[11613) 


才 a 
将 左 指针 ( 值 为 5 ) 与 轴 比 较 。 它 比 轴 小 吗 ? 不 。 于 是 左 指针 停 在 这 里 ， 下 一 步 我 们 启动 右 指针 。 
第 3 步 : 比较 右 指 针 ( 值 为 6) 和 轴 。 它 比 轴 大 吗 ? 对 。 于 是 右 指针 左 移 。 
第 4 步 : 左 移 右 指针 。 
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比较 右 指 针 ( 值 为 1) 和 轴 。 它 比 轴 大 吗 ? 不 。 于 是 右 指针 停 下 。 
第 5 步 : 因为 两 个 指针 都 停 住 了 ， 所 以 交换 它们 的 值 。 


5 
NG 


0j1l2151619 

















随后 ， 再 次 启动 左 指针 。 
第 6 步 : 右 移 左 指针 。 











911121516l3) 


比较 左 指针 值 为 2) 和 轴 。 它 比 轴 小 吗 ?” 对。 于 是 继续 右 移 。 
第 7 步 : 左 指针 移 到 下 一 格子 。 注 意 ， 这 时 两 个 指针 都 指向 同一 个 值 了 。 


011121516l3) 


比较 左 指针 和 轴 。 由 于 左 指针 的 值 比 轴 要 大 , 我 人 i 。 而 且 现 在 左 指针 与 右 指针 重合 ， 
无 须 再 移动 指针 了 。 


第 8 步 : 到 了 分 区 的 最 后 一 步 ， 将 左 指针 的 值 与 轴 交 换 位 置 。 


DR 
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虽然 数组 还 没完 全 排 好 序 ， 但 我 们 已 完成 了 一 次 分 区 。 即 比 轴 ( 值 为 3 ) 小 的 值 都 聚 在 了 它 
的 左 侧 ， 比 轴 大 的 值 都 聚 在 了 它 的 右 侧 ， 这 就 意味 着 3 已 经 被 放置 到 正确 的 位 置 上 了 。 


M7 


9|1l2131615 


PEEY 


下 面 是 用 Ruby 写 的 SortableArray 类 ,其 中 的 partition! 方 法 能 如 上 所 述 对 数组 进行 分 区 。 


class SortableArray 








attr_reader :array 


def initialize(array) 
@array = array 
end 


def partition!(left pointer, right pointer) 


# 总 是 取 最 右 的 值 作为 轴 
pivot position = right pointer 
pivot = @array[pivot position] 


# 将 右 指 针 指 向 轴 左 边 的 一 格 
right pointer -= 1 


while true do 


while @array[left pointer] < pivot do 
left pointer += 1 
end 


while @array[right pointer] > pivot do 
right pointer -= 1 
end 





if left pointer >= right pointer 
break 
else 
swap(left pointer, right pointer) 
end 


end 


人 # 最 后 将 左 指针 的 值 与 轴 交 换 
swap(left pointer，pivot _ position) 


# 根据 快速 排序 的 需要 ， 返 回 左 指针 
# 具体 原因 接 下 来 会 解释 
return Left pointer 

end 
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def swap(pointer 1, pointer 2) 
temp_value = @array[pointer 1] 
Garray[pointer 1] = @array[lpointer 2] 
@array[pointer 2] = temp_value 

end 


end 


此 partition! 方 法 接受 两 个 参数 作为 左 指针 和 右 指 针 的 起 始 位 置 ， 并 在 结束 时 返回 左 指针 
的 最 终 位置 。 这 是 实现 快速 排序 所 必需 的 ， 下 面 我 们 将 会 看 到 。 














10.2 ”快速 排序 


快速 排序 严重 依赖 于 分 区 。 它 的 运作 方式 如 下 所 示 。 
(1) 把 数组 分 区 。 使 轴 到 正确 的 位 置 上 去 。 
(2) 对 轴 左 右 的 两 个 子 数 组 递归 地 重复 第 1、2 步 ， 也 就 是 说 ， 两 个 子 数组 都 各 自分 区 ， 并 形 
成 各 自 的 轴 以 及 由 轴 分 隔 的 更 小 的 子 数组 。 然 后 也 对 这 些 子 数组 分 区 ， 以 此 类 推 。 

(3) 当 分 出 的 子 数组 长 度 为 0 或 1 时 ， 即 达到 基准 情形 ， 无 须 进 一 步 操作 。 
将 以 下 quicksort! 方 法 加 到 刚才 的 SortableArray 类 中 ， 人 快速 排序 就 完整 了 。 
def quicksort! (left index, right index) 

休 基准 情形 : 分 出 的 子 数组 长 度 为 上 或 1 

if right index - left index <= 0 


return 
end 























休 将 数组 分 成 两 部 分 ， 并 返回 分 隔 所 用 的 轴 的 索引 
pivot _ position = partition!(left index, right index) 


# 对 轴 左 侧 的 部 分 递归 调用 quicksort 
quicksort!(left index, pivot position - 1) 


# 对 轴 右 侧 的 部 分 递归 调用 quicksort 
quicksort! (pivot position + 1, right index) 
end 


想 看 实际 效果 的 话 ， 可 执行 以 下 代码 。 


array = [0, 5, 2, 1, 6, 3] 

sortable array = SortableArray.new(array) 
sortable array.quicksort!(0, array.length - 1) 
p sortable array.array 


再 回 到 刚才 的 例子 。 最 初 的 数组 是 [0，5，2，1，6，3] ， 然 后 我 们 做 了 一 次 分 区 。 所 以 我 
们 的 快速 排序 已 经 有 一 点 进度 了 ， 目 前 状态 如 下 。 
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正如 你 看 到 的 , 其 中 3 为 轴 。 它 已 经 处 于 正确 的 位 置 , 接 下 来 对 其 左右 两 侧 的 元 素 进行 排序 。 
注意 ， 虽 然 我 们 看 到 左 侧 的 元 素 碰 巧 已 经 按 顺序 排 好 了 ， 但 计算 机 是 不 知道 的 。 


下 一 步 ， 我 们 把 轴 左 侧 的 那些 元 素 当 作 一 个 独立 的 数组 来 分 区 。 
除 此 之 外 的 元 素 则 先 不 用 看 ， 和 暂时 给 它们 涂 上 阴影 。 


现在 ， 对 于 这 个 [6，1，2] 的 子 数组 ， 我 们 选取 其 最 右 端 的 元 素 作 为 轴 。 于 是 ， 轴 为 2。 


0IOBI 加 











然后 ， 设 置 左 右 指针 。 
A KK 
让 我 们 接着 之 前 的 第 8 步 ， 开 始 子 数组 的 分 区 。 


第 9 步 : 比较 左 指针 ( 值 为 0 ) 与 轴 ( 值 为 2)， 由 于 0 小 于 轴 ， 可 将 左 指针 右 移 。 
第 10 步 : 将 左 指针 右 移 _ 格 ， 这 时 它 刚好 跟 右 指针 重合 了 。 [| 


流 了 
比较 左 指针 与 轴 。 由 于 1 小 于 轴 ， 继 续 右 移 。 
第 11 步 : 将 左 指针 右 移 一 格 ， 它 便 指 向 轴 了 。 


OBE 加 


( 右 指针 )  ( 左 指针 ) 
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这 时 左 指针 的 值 与 轴 相 等 了 ( 因为 它 正 指向 轴 )， 左 指针 停 下 。 
第 12 步 : 启动 右 指针 。 然 而 ， 右 指针 ( 值 为 1 ) 小 于 轴 ， 所 以 不 用 动 。 
因为 左 指针 已 经 跑 到 右 指针 的 右边 了 ， 所 以 本 次 分 区 无 须 再 移动 指针 。 


第 13 步 : 最 后 ， 将 左 指针 的 值 跟 轴 交换 。 但 左 指针 已 经 指向 轴 ， 因 此 轴 与 自身 交换 ， 结 果 
没有 任何 改变 。 至 此 ,分 区 完成 ， 轴 ( 值 为 2) 也 到 达 正 确 位 置 了 。 


于 是 轴 ( 值 为 2) 分 出 了 左 侧 的 子 数组 [9, 1] ， 右 侧 没有 子 数组 。 那 么 接 下 来 将 左 侧 的 [0, 1] 分 区 。 
为 了 专注 于 [6，1] ， 我 们 将 其 余 的 元 素 涂 上 阴影 。 


然后 选取 其 最 右 的 元 素 〈 值 为 1 ) 作为 轴 。 但 是 左右 指针 应 该 如 何 放置 呢 ? 是 的 ， 左 指针 指 
向 0， 右 指针 因为 总 是 从 轴 左 侧 那 格 开 始 ， 所 以 也 是 指向 0， 如 下 所 示 。 


ORBEE 






































可 以 开始 分 区 了 。 
第 14 步 : 比较 左 指针 ( 值 为 0) 与 轴 ( 值 为 1 )。 


它 比 轴 小 ， 继 续 右 移 。 
第 15 步 : 将 左 指针 往 右 移 一 格 ， 这 时 它 指向 了 轴 。 


NIEIAI 
回回 


( 右 指针 ) 民风 ( 左 指针 ) 




















由 于 左 指针 不 再 小 于 轴 了 ( 因为 它 的 值 就 是 轴 )， 于 是 停 下 。 
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第 16 步 : 比较 右 指针 与 轴 。 由 于 其 值 小 于 轴 ， 就 不 用 再 左 移 了 。 而 且 现 在 左 指针 走 到 了 右 
指针 的 右边 ， 所 以 指针 无 须 继续 移动 ， 可 以 进入 最 后 一 步 。 

第 17 步 : 将 左 指针 与 轴 交 换 。 但 同样 地 ， 这 次 左 指针 也 指向 了 轴 ， 所 以 交换 不 会 产生 什么 
位 置 改 变 。 于 是 轴 的 位 置 便 排 好 了 ， 分 区 结束 。 


此 时 数组 如 下 所 示 。 
接着 ， 对 最 近 一 次 的 轴 的 左 侧 子 数组 [0] 进 行 分 区 。 因 为 它 只 包含 一 个 元 素 ， 到 达 了 “数组 


长 度 为 0 或 1” 的 基准 情形 ， 所 以 我 们 什么 都 不 用 干 。 该 元 素 已 随 着 之 前 的 分 区 被 挪 到 了 正确 的 
位 置 。 现 在 数组 如 下 所 示 。 





























NAVMIIIAIIIIIIIOIIISIOAIIEIIMI 
~ 
~ 
> 
有 EMM MA MM 


mn 





最 开始 我 们 以 3 为 轴 ， 然 后 把 其 左 侧 的 子 数组 [6，1，2] 做 了 分 区 。 按 照 约定 ， 现 在 轮 到 了 
它 右 侧 的 [6，5]。 


[6，1，2，3] 已 经 排 好 了 ， 所 以 将 它们 涂 上 阴影 ， 以 便 我 们 专注 于 [6，5]。 


VISITIVIIIAI 
VOIDETII 


接 下 来 的 分 区 以 最 右 端 的 元 素 〈 值 为 5 ) 为 轴 ， 如 下 所 示 。 


RY 


NVSILOIIIIIIIOIIVIIIVI 
10j121316 © 
左右 指针 只 能 同时 指向 6。 


第 18 步 :比较 左 指针 ( 值 为 6) 与 轴 ( 值 为 5)。 由 于 6 大 于 轴 ， 左 指针 不 再 右 移 。 


第 19 步 : 本 来 指 着 6 的 右 指针 应 该 左 移 ， 但 6 的 左边 已 经 没有 其 他 元 素 了 ， 所 以 右 指针 停 
止 。 由 于 左 指针 与 右 指 针 重 合 ， 也 不 用 再 做 任何 移动 了 ， 可 以 跳 到 最 后 一 步 。 
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第 20 步 : 将 左 指针 的 值 与 轴 交 换 。 
这 样 轴 ( 值 为 5 ) 就 放 到 正确 位 置 上 了 ， 数 组 变 成 了 下 面 这 样 。 


2 三 


尽管 随后 我 们 应 该 递归 地 对 [5，6] 左 右 两 侧 的 子 数组 进行 分 区 ， 但 现在 轴 左 侧 没有 元 素 ， 
右 侧 也 只 有 长 度 为 1 的 子 数组 ， 即 到 达 了 基准 情形 V 置 。 
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于 是 整个 排序 完成 ! 


10.3 ”快速 排序 的 效率 

为 了 搞 清 楚 快 速 排序 的 效率 ， 我 们 先 从 分 区 开始 。 分 解 来 看 ， 你 会 发 现 它 包 含 两 种 步骤 。 
口 比较 : 每 个 值 都 要 与 轴 做 比较 。 
口 交换 : 在 适当 时 候 将 左右 指针 所 指 的 两 个 值 交换 位 置 。 
一 次 分 区 至 少 有 N 次 比较 , 即 数组 的 每 个 值 都 要 与 轴 做 比较 。 因 为 每 次 分 区 时 , 左右 指针 都 
会 从 两 端 开始 靠近 ， 直 到 相遇 

交换 的 次 数 则 取决 于 数据 的 排列 情况 。 一 次 分 区 里 ， 交 换 最 少 会 有 1 次 ， 最 多 会 有 N/2 次 ， 
因为 即使 所 有 元 素 都 需要 交换 ， 我 们 也 只 是 将 左 半 部 分 与 右 半 部 分 进行 交换 ， 如 下 图 所 示 。 


71615131211] @ 
NS 





























对 于 随机 排列 的 数据 ,粗略 来 算 就 是 N/2 的 一 半 ， 即 W/4 次 交换 。 于 是 ，V 次 比较 加 上 N/4 
次 交换 ， 共 1.25N 步 。 最 后 根据 大 O 记 法 的 规则 ， 和 忽略 常数 项 ， 得 出 分 区 操作 的 时 间 为 O(N)。 
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这 就 是 一 次 分 区 的 效率 。 但 完整 的 快速 排序 需要 对 多 个 数组 以 及 不 同 大 小 的 子 数组 分 区 , 想 
知道 整个 过 程 所 花 的 时 间 ， 还 要 再 进一步 分 析 才 行 。 
为 了 更 形象 地 描述 , 我 们 将 一 个 含有 8 个 元 素 的 数组 的 快速 排序 过 程 画 了 出 来 。 它 旁边 有 每 


一 次 分 区 所 作用 的 元 素 个 数 。 由 于 元 素 值 并 不 重要 ， 因 此 就 不 显示 了 。 注意, 作用 范围 就 是 那些 
白色 的 格子 。 
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第 5 次 分 区 : 4 个 元 素 
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> 第 6 次 分 区 : 2 个 元 素 
DAT NAL A rw 

LI A A Md 

~ 

= 第 7 次 分 区 : 1 个 元 素 
A A NN TN rw 

LI LI LEI EAAM LI7 

~ 

~ 第 8 次 分 区 : 1 个 元 素 
二 


RA 人 NE 


这 里 有 8 次 分 区 ,但 每 次 作用 的 范围 大 小 不 一 。 因 为 只 含 1 个 元 素 的 子 数组 就 是 基准 情形 ， 
无 须 任何 交换 和 比较 ， 所 以 只 有 元 素 量 大 于 或 等 于 2 的 子 数组 才 要 算 分 区 。 


由 于 此 例 属于 平均 情况 的 一 种 ， 因 此 我 们 假设 每 次 分 区 大 约 要 花 1.25V 步 ， 得 出 : 




















8 个 元 素 * 1.25 = 10 步 
3 个 元 素 * 1.25 = 3.75 步 
4 个 元 素 * 1.25 = 5 步 

+ 2 个 元 素 * 1.25 = 2.5 步 


总 共 约 为 21 步 
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如 果 再 对 不 同 大 小 的 数组 做 统计 ， 你 会 发 现 NW 个 元 素 ， 就 要 NWxlog N 步 。 想 体会 什么 是 Nx 
log N 的 话 ， 可 参考 下 表 。 














N logN NxlogN 
4 2 8 
8 3 24 

16 4 64 


在 上 面 一 个 数组 含 8 个 元 素 的 例子 中 , 快速 排序 花 了 大 约 21 步 , 也 很 接近 8 x log8 ( 等 于 24 )。 
这 种 时 间 复 杂 度 的 算法 我 们 还 是 第 一 次 遇 到 ， 用 大 0 记 法 来 表达 的 话 ， 它 是 O(N log 入) 算法 。 


快速 排序 的 步 数 接近 Nx log YX 绝 非 偶 然 。 如 果 我 们 以 更 平均 的 情况 来 考察 快速 排序 ， 就 能 
出 原因 了 。 


快速 排序 开始 时 会 对 整个 数组 进行 分 区 。 假设 此 次 分 区 会 将 轴 最 终 安放 到 数组 中 央 一 一 这 也 
是 平均 情况 一 一 然后 我 们 就 要 对 由 此 切 开 的 两 半 进 行 分 区 。 巧合 的 是 , 它们 的 轴 也 最 终 落 在 各 自 
的 中 央 , 分 出 4 个 大 小 为 原 数 组 四 分 之 一 的 子 数组 。 并且, 接 下 来 所 有 分 区 都 出 现 了 这 种 轴 在 中 
央 的 情况 。 


这 样 一 来 ,我们 基本 上 就 是 在 不 断 地 对 半 切 分 子 数组 , 直至 产生 出 的 子 数组 长 度 为 1。 那么 ， 
一 个 数组 要 经 历 多 少 次 分 区 才能 切 到 这 人 么 小 呢 ? 如 果 数 组 元 素 有 N 个 , 那 就 是 logN 次 。 假 设 元 
素 有 8 个 , 那 就 要 对 半 切 3 次 ,才能 分 出 只 有 1 个 元 素 的 子 数组 。 这 个 原理 你 应 该 在 二 分 查找 那 
节 学 过 了 。 


对 两 个 新 的 子 数组 所 执行 的 分 区 操作 ， 需 要 处 理 的 数据 量 还 是 相当 于 对 原 数组 所 做 的 分 区 。 


如 下 图 所 示 。 
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因为 等 分 发 生 了 log N 次 ， 而 每 次 都 要 对 总 共 N 个 元 素 做 分 区 ， 所 以 总 步 数 为 Vx log N。 


之 前 我 们 看 到 的 很 多 算法 ,最 佳 情况 都 发 生 在 元 素 有 序 的 时 候 。 但 在 快速 排序 里 , 最 佳 情 况 
应 该 是 每 次 分 区 后 轴 都 刚好 落 在 子 数组 的 中 间 。 











10.4 ”最 坏 情 况 


快速 排序 最 坏 的 情况 就 是 每 次 分 区 都 使 轴 落 在 数组 的 开头 或 结尾 。 导致 这 种 情况 的 原因 有 好 
儿 种 ,包括 数组 已 升序 排列 ,或 已 降序 排列 。 下 面 我 们 把 这 种 情况 用 图 来 说 明 一 下 。 
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- 第 5 次 分 区 : 4 个 元 素 
AAAWIAIIIVWAMIIIIAWAWIAILIIAA 

VANEAAIMTIIAOAMTIIAAAMTIAIAAOA IAAI 

站 i 和 

~ 第 6 次 分 区 : 3 个 元 素 
TEYTEIENETTYIEEETT EE 

NAWIITAYAIWIIIYAAAILITIAAIAWIIIAALAWIIIAAISIEAALA 

时 网 4 

- 第 7 次 分 区 : 2 个 元 素 
TTTEEETTYEEEITEE 


虽然 在 此 情况 下 ,每 次 分 区 都 只 有 一 次 交换 , 但 比较 的 次 数 却 变 得 很 多 。 在 轴 总 落 在 中 央 的 
例子 里 ， 每 次 分 区 都 能 划分 出 比 原 数组 小 得 多 的 子 数组 ( 过 程 中 产生 的 最 大 的 子 数组 长 度 为 4 )， 
使 各 部 分 都 能 很 快 地 到 达 基 准 情形 。 然 而 如 果 轴 落 在 其 中 一 端 , 前 5 次 分 区 就 需要 处 理 长 度 大 于 
4 的 数组 。 而 且 这 5 次 分 区 里 ， 每 次 所 需 的 比较 次 数 还 是 和 子 数组 的 元 素 量 一 样 多 。 

于 是 在 最 坏 情况 下 ,， 对 8+7+6+5+4+3+2 个 元 素 进 行 分 区 ， 一 共 35 次 比较 。 



































写成 公式 的 话 ， 就 是 NN 个 元 素 , 需要 N+(N-1)+(N-2)+(N-3)+…+2 步 ， 即 N”Y2 步 ， 
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如 下 图 所 示 。 








又 因为 大 0 忽略 常数 ， 所 以 最 终 我 们 会 说 ， 快 速 排 序 最 坏 情况 下 的 效率 为 OOV”)。 











既然 把 快速 排序 分 析 完 了 ， 我 们 将 它 与 搬入 排序 比较 一 下 。 








最 好 情况 平均 情况 最 坏 情 况 
插入 排序 O(N) OU O(N’) 
快速 排序 O(N log N) O(N log N) O(N’) 


虽然 快速 排序 在 最 好 情况 和 最 坏 情况 都 没 能 超越 插入 排序 , 但 在 最 常 遇见 的 平均 情况 , 前 者 
的 O(N log 入 ) 比 后 者 的 O(N ) 好 得 多 ， 所 以 总 体 来 说 ， 快 速 排 序 优 于 插入 排序 。 


以 下 是 各 种 时 间 复 杂 度 的 对 比 。 
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元 素数 量 














由 于 快速 排序 在 平均 情况 下 表现 优异 ， 于 是 很 多 编程 语言 自 带 的 排序 函数 都 采用 它 来 实现 。 








因此 一 般 你 不 需要 自己 写 快速 排序 ,但 你 可 能 需要 学 会 写 快速 选择 
实用 算法 。 








它 是 一 种 类 似 快速 排序 的 





10.5 ”快速 选择 

假设 有 一 个 无 序 的 数组 ， 你 不 需要 将 它 排序 ， 只 要 找 出 里 面 第 10 小 的 值 ， 或 第 5 大 的 值 。 
就 像 从 一 堆 测 试 成 绩 中 找 出 第 25 百 分 位 ， 或 找 出 中 等 成 绩 那样 。 

你 首先 想到 的 ， 可 能 是 把 整个 数组 排序 ， 然 后 再 跳 到 对 应 的 格子 里 去 找 。 

但 这 样 做 的 话 ， 即 使 是 用 快速 排序 那样 高 效 的 算法 ， 一般 也 需要 O(N log N)。 虽 然 这 也 不 算 
差 ， 但 一 种 名 为 快速 选择 的 算法 可 以 做 得 更 好 。 快 速 选择 需要 对 数组 分 区 ， 这 跟 快速 排序 类 似 ， 
或 者 你 可 以 把 它 想象 成 是 快速 排序 和 二 分 查找 的 结合 。 

如 之 前 所 述 ， 分 区 的 作用 就 是 把 轴 排 到 正确 的 格子 上 。 人 快速 选择 就 利用 了 这 一 点 。 

例如 要 在 一 个 长 度 为 8 的 数组 里 ， 找 出 第 2 小 的 值 。 

先 对 整个 数组 分 区 。 


天 本 画面 画面 画册 | 


轴 很 可 能 落 到 数组 中 间 某 个 地 方 。 
现在 轴 已 安放 在 正确 位 置 了 , 因为 那 是 第 5 个 格子 , 所 以 我 们 掌握 了 数组 第 5 小 的 值 是 什么 。 


虽然 我 们 要 找 的 是 第 2 小 的 值 , 但 刚才 的 操作 足以 让 我 们 忽略 轴 右 侧 的 那些 元 素 , 将 查找 范围 缩 
小 到 轴 左 侧 的 子 数组 上 。 这 看 起 来 就 像 是 不 断 地 把 查找 范围 缩小 一 半 的 二 分 查找 。 


然后 ， 继 续 对 轴 左 侧 的 子 数组 分 区 。 [| 


























































































































假设 子 数组 的 轴 最 后 落 到 第 3 个 格子 上 。 
现在 第 3 个 格子 的 值 已 经 确定 了 , 该 值 就 是 数组 第 3 小 的 值 , 第 2 小 的 值 也 就 是 它 左 侧 的 某 
个 元 素 。 于 是 再 对 它 左 侧 的 元 素 分 区 。 
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这 次 分 区 过 后 ， 最 小 和 第 2 小 的 元 素 也 就 能 确定 了 。 


AAAAIAIIIAAML VETTAA 


srs 


第 2 小 的 值 


这 么 一 来 ,我 们 就 可 以 拿 出 第 2 个 格子 的 值 ， 告 诉 别人 找到 第 2 小 的 元 素 了 。 快速 选择 的 优 


势 就 在 于 它 不 需要 把 整个 数组 都 排序 就 可 以 找到 正确 位 置 的 值 。 

















如 果 像 快速 排序 那样 ， 每 次 分 区 后 还 是 要 处 理 原 数组 那么 多 的 数据 ， 就 会 导致 O(N log N) 的 











步 数 。 但 快速 选择 不 同 , 下 一 次 的 分 区 操作 只 需 在 上 一 次 分 出 的 一 半 








的 那 一 半 。 


分 析 快 速 选择 的 效率 ， 你 会 发 现 它 的 平均 情况 是 O(N)。 回 想 每 次 分 区 的 步 数 大 约 等 于 作用 





区 域 上 进行 ， 即 值 可 能 存在 





数组 的 元 素 量 ， 你 便 可 算出 ， 对 于 一 个 含有 8 个 元 素 的 数组 , 会 有 3 次 分 区 : 第 一 次 处 理 整个 数 























就 是 8+4+2=14 步 。 于 是 8 个 元 素 大 概 是 14 步 。 

















组 的 8 个 元 素 , 第 二 次 处 理子 数组 的 4 个 元 素 , 还 有 一 次 处 理 更 小 的 子 数组 的 2 个 元 素 。 加 起 来 





如 果 是 64 个 元 素 , 就 会 是 64+32+16+8+4+2=126 步 ; 如 果 是 128 个 元 素 , 就 会 是 254 步 ; 





如 果 是 256 个 元 素 ， 就 会 是 510 步 。 























用 公式 来 表达 ， 就 是 对 于 NN 个 元 素 , 会 有 N+ (N/2)+(N/4)+(N/8)+…+2 步 。 结 果 大 概 





























是 2N 步 。 由 于 大 O 忽 略 常数 ,我 们 最 终 会 说 快速 选择 的 效率 为 O(N)。 


你 可 以 把 以 下 实现 了 快速 选择 的 quickselect! 方 法 加 到 刚才 的 SortableArray 里 。 你 会 








发 现 它 跟 quicksort 1! 很 像 。 


def quickselect!(kth lowest value, left index, right index) 
# 当 子 数组 只 剩 一 个 格子 一 一 即 达到 基准 情形 时 ， 
# 那 我 们 就 找到 所 需 的 值 了 
if right index - left index <= 0 
return Garray[Left index] 
end 


人 ## 将 数组 分 成 两 部 分 ， 并 返回 分 隔 所 用 的 轴 的 索引 
pivot _ position = partition!(left index, right index) 


if kth lowest value < pivot position 


quickselect!(kth lowest value, left index, pivot position - 


elsif kth lowest value > pivot position 


quickselect!(kth lowest value, pivot position + 1, right index) 


else # 至 此 kth lowest value 只 会 等 于 pivot position 
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## 如 果 分 区 后 返回 的 轴 的 索引 等 于 kth_Lowest_VvaLue， 
# 那 这 个 轴 就 是 我 们 要 找 的 值 
return Qarray[pivot_position] 
end 
end 


想 要 从 一 个 无 序数 组 中 找 出 第 2 小 的 值 ， 可 以 运行 如 下 代码 。 


array = [0, 50, 20, 10, 60, 30] 
sortable array = SortableArray.new(array) 
p sortable array.quickselect!(1, 0, array.length - 1) 


此 方法 的 第 一 个 参数 是 查找 的 位 置 。 因 为 数组 索引 从 0 开始 算 起 ,所 以 我 们 传 入 1 来 查找 第 
2 小 的 值 。 





10.6 总结 


由 于 运用 了 递归 , 快速 排序 和 快速 选择 可 以 将 棘手 的 问题 解决 得 既 巧 妙 又 高 效 。 这 也 提醒 了 
我 们 ， 有 些 看 上 去 很 普通 的 算法 ， 可 能 是 经 过 反复 推 殴 的 高 性 能 解法 。 
其 实 能 递归 的 不 只 有 算法 , 还 有 数据 结构 。 后 面 儿童 将 要 接触 的 链表 、 二 又 树 以 及 图 ， 就 利 


用 了 自身 递归 的 特性 ， 给 我 们 提供 了 迅速 的 数据 操作 方式 。 
































基于 结 点 的 数据 结构 








接 下 来 的 几 章 将 要 学 习 的 各 种 数据 结构 , 都 涉及 一 种 概念 
有 独特 的 存 取 方 式 ， 因 此 在 某 些 时 候 具 有 性 能 上 的 优势 。 

本 章 我 们 会 探讨 链表 ， 它 是 最 简单 的 一 种 基于 结 点 的 数据 结构 ， 而 且 也 是 后 续 内 容 的 基础 。 
你 会 发 现 ， 虽 然 链 表 和 数组 看 上 去 差不多 ， 但 在 性 能 上 却 各 有 所 长 。 





结 点 。 基 于 结 点 的 数据 结构 拥 











11.1 ”链表 


像 数 组 一 样 ， 链 表 也 用 来 表示 一 系列 的 元 素 。 事 实 上 ,能 用 数组 来 做 的 事情 ,一 般 也 可 以 用 
链表 来 做 。 然 而 ， 链 表 的 实现 跟 数 组 是 不 一 样 的 ， 在 不 同 场景 它们 会 有 不 同 的 性 能 表现 。 

如 第 1 章 所 述 , 计算 机 的 内 存 就 像 一 大 堆 格子 ,每 格 都 可 以 用 来 保存 比特 形式 的 数据 。 当 要 
创建 数组 时 , 程序 会 在 内 存 中 找 出 一 组 连续 的 空格 子 , 给 它们 起 个 名 字 , 以 便 你 的 应 用 存放 数据 ， 
见 下 图 。 





我 们 之 前 说 过 ,计算 机 能 够 直接 跳 到 数组 的 某 一 索引 上 。 如 果 代 码 要 求 它 读 取 索引 4 的 值 ， 





11.2 ”实现 一 个 链表 107 











那么 计算 机 只 需 一 步 就 可 以 完成 任务 。 重 申 一 次 , 之 所 以 能 够 这 样 ， 是 因为 程序 事先 知道 了 数组 
开头 所 在 的 内 存 地 址 一 一 例如 地 址 是 1000 一 一 当 它 想 去 索引 4 时， 便 会 自动 跳 到 1004 处 。 


与 数组 不 同 的 是 , 组 成 链表 的 格子 不 是 连续 的 。 它 们 可 以 分 布 在 内 存 的 各 个 地 方 。 这 种 不 相 
邻 的 格子 ， 就 叫 作 结 点 。 


那么 问题 来 了 ， 计 算 机 怎么 知道 这 些 分 散 的 结 点 里 ， 哪 些 属于 这 个 链表 ， 哪 些 属 于 其 他 链 
表 呢 ? 


这 就 是 链表 的 关键 了 : 每 个 结 点 除了 保存 数据 ， 它 还 保存 着 链表 里 的 下 一 结 点 的 内 存 地 址 。 
这 份 用 来 指示 下 一 结 点 的 内 存 地 址 的 额外 数据 ， 被 称 为 链 。 链 表 如 下 图 所 示 。 
A ~” 达 A 






































数据 链 
此 例 中 ,我 们 的 链表 包含 4 项 数据 :"a"、"b"、"c" 和 "d"。 因 为 每 个 结 点 都 需要 2 个 格子 ， 
头 一 格 用 作 数 据 存储 ， 后 一 格 用 作 指 向 下 一 结 点 的 链 ( 最 后 一 个 结 点 的 链 是 nuLL， 因 为 它 是 终 
点 )， 所 以 整体 占用 了 8 个 格子 。 


若 想 使 用 链表 , 你 只 需 知 道 第 一 个 结 点 在 内 存 的 什么 位 置 。 因 为 每 个 结 点 都 有 指向 下 一 结 点 
的 链 ， 所 以 只 要 有 给 定 的 第 一 个 结 点 ， 就 可 以 用 结 点 1 的 链 找到 结 点 2， 再 用 结 点 2 的 链 找到 结 
点 3…… 如 此 遍历 链表 的 剩余 部 分 。 


链表 相对 于 数组 的 一 个 好 处 就 是 , 它 可 以 将 数据 分 散 到 内 存 各 处 , 无 须 事先 寻找 连续 的 空格 子 。 
























































11.2 ”实现 一 个 链表 


我 们 用 Ruby 来 写 一 个 链表 ， 最 终 实现 包含 两 个 类 : Node 和 LinkedList。 先 是 Node。 


class Node 








attr_accessor :data, :next node 
def initialize(data) 
@data = data 


end 


end 


Node 类 有 两 个 属性 : data 表示 结 点 所 保存 的 数据 ，next_node 表示 指向 下 一 结 点 的 链 , 使 
用 方法 如 下 。 
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node 1 = Node.new("once") 
node 2 = Node.new("upon") 
node 1.next node = node 2 


node 3 = Node.new("a") 
node 2.next node = node 3 


node 4 = Node.new( "time") 
node 3.next _ node = node 4 


以 上 代码 创建 了 4 个 连 起 来 的 结 点 , 它们 分 别 保存 着 "once" 、"upon" 、"a" 和 "time" 4 项 数据 。 











虽然 只 用 Node 也 可 以 创建 出 链表 ， 但 我 们 的 程序 无 法 由 此 轻易 地 得 知 哪个 结 点 是 链表 的 开 


端 。 因 此 我 们 还 得 创建 一 个 LinkedList 类 。 下 面 是 一 个 最 基本 的 LinkedList 的 写法 。 


class LinkedList 
attr_accessor :first node 
def initialize(first node) 
@first node = first node 


end 


end 


有 了 这 个 类 ， 我们 就 可 以 用 以 下 代码 让 程序 知道 链表 的 起 始 位 置 了 。 


List = LinkedList.new(node 1) 





LinkedList 的 作用 就 是 一 个 指针 ， 它 指向 链表 的 第 一 个 结 点 。 























既然 知道 了 链表 是 什么 ,那么 接 下 来 做 个 它 跟 数组 的 怕 
入 和 删除 上 有 何 优 劣 。 


11.3” 读 取 





能 对 比 ， 观 察 它们 在 读 取 


、 查 找 、 插 


我 们 曾经 说 过 ， 当 计算 机 要 从 数组 中 读 取 一 个 值 时 ，, 它 会 一 步 跳 到 对 应 的 格子 上 ， 其 效率 为 

















O(1)。 但 在 链表 中 就 不 是 这 样 了 。 





假设 程序 要 读 取 链 表 中 索引 2 的 值 , 计算 机 不 可 能 在 一 步 之 内 完成 ,因为 无 法 一 下 子 算出 它 
在 内 存 的 哪个 位 置 。 毕 竞 , 链表 的 结 点 可 以 分 布 在 内 存 的 任何 地 方 。 程序 知道 的 只 有 第 1 个 结 点 





的 内 存 地 址 ， 要 找到 索引 2 的 结 点 〈 即 第 3 个 )， 程 序 必须 先 读 取 索引 0 的 链 ， 然 后 顺 着 该 链 去 























找 索引 1。 接 着 再 读 取 索 引 1 的 链 ， 去 找 索 引 2， 这 才能 读 取 到 索引 2 里 的 值 。 











下 面 我 们 在 LinkedList 类 中 加 入 读 取 操作 。 


class LinkedList 


attr_accessor :first node 
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def initialize(first node) 
@first node = first node 
end 


def read(index) 
# 从 第 一 个 结 点 开始 
current node = first_node 
current index = 0 


while current index < index do 
# 顺 着 链 往 下 找 ， 直 至 我 们 要 找 的 那个 索引 值 
current node = current node.next node 
current index += 1 


## 如 果 读 到 最 后 一 个 结 点 之 后 ， 就 说 明 
# 所 找 的 索引 不 在 链表 中 ， 因 此 返回 nil 
return nil unless current node 
end 
return current node.data 
end 


end 

当 想 要 读 取 某 个 索引 时 ， 可 以 这 样 写 : 

list.read(3) 

读 取 链 表 中 某 个 索引 值 的 最 坏 情况 ,应 该 是 读 取 最 后 一 个 索引 。 这 种 情况 下 ， 因 为 计算 机 得 
从 第 一 个 结 点 开始 ， 沿 着 链 一 直 读 到 最 后 一 个 结 点 ， 于 是 需要 N 步 。 由 于 大 O 记 法 默认 采用 最 坏 
情况 ， 所 以 我 们 说 读 取 链 表 的 时 间 复杂 度 为 OO。 这 跟 读 取 数组 的 0(1) 相 比 ， 的 确 是 一 大 劣势 。 











11.4 ”查找 


链表 的 查找 效率 跟 数 组 一 样 。 记 住 ， 所 谓 查 找 就 是 从 列表 中 找 出 某 个 特定 值 所 在 的 索引 。 对 
于 数组 和 链表 来 说 ,它们 都 是 从 第 一 格 开始 逐个 格子 地 找 ,， 直至 找到 。 如 果 是 最 坏 情况 ， 即 所 找 
的 值 在 列表 末尾 ， 或 完全 不 在 列表 里 ， 那 就 要 花 O(N) 步 。 

下 面 是 查找 方法 的 实现 。 


class LinkedList 
































attr_accessor :first node 
## 其 他 方法 略 …… 


def index of(value) 
# 从 第 一 个 结 点 开始 
current node = first node 
current index = 0 
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begin 
林 如 果 找 到 ， 就 返回 
if current node.data == value 
return current index 
end 


# 否则 ， 看 下 一 个 结 点 
current node = current node.next node 
current index += 1 

end while current node 


玫 如 果 遍 历 整个 链表 都 没 找到 ， 就 返回 nil 
return nil 
end 
end 
有 了 它 我 们 就 可 以 这 样 来 查找 了 : 


list.index of("time") 


11.5 插入 


在 茶 些 情况 下 ， 链 表 的 插 人 跟 数 组 相 比 ， 有 着 明显 的 优势 。 回 想 插 和 数组 的 最 坏 情况 : 当 插 
入 位 置 为 索引 0 时 ， 因 为 需要 先 将 插入 位 置 右 侧 的 数据 都 右 移 一 格 ， 所 以 会 导致 O(N) 的 时 间 复 
杂 度 。 然 而 ， 若 是 往 链 表 的 表 头 进行 插入 ， 则 只 需 一 步 ， 即 0(1)。 下 面 看 看 为 什么 。 


假设 我 们 的 链表 如 下 所 示 。 


me 4 


要 在 表 头 增加 "yeLLow"， 我 们 只 需 创 建 一 个 新 的 结 点 ， 然 后 使 其 链接 到 "btue" 那 一 结 点 


一 Do 














1 1 下 
， [| 十 于 Fb] 十 * 四 四 
1 1 下 
有 


因为 无 须 平移 其 他 数据 ， 所 以 与 数组 相 比 ， 链 表 在 前 端 插 和 人 数据 更 为 便捷 


[= 


虽然 理论 上 在 链表 的 任何 一 处 做 插入 都 只 需要 1 步 , 但 事实 上 没 那 么 简单 。 假 设 现 在 链表 是 
这 样 的 : 


| 7 








O 
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然后 我 们 想 在 索引 2("blue" 和 "green" 之 间 ) 插 入 "purple"。 由 于 插入 动作 创建 了 一 个 新 
的 结 点 ， 如 下 图 那样 改动 "blue" 和 "purptle" 的 链 ， 因 此 实际 的 操作 只 需 1 步 。 


| 4 


但 是 ， 在 该 动作 之 前 ， 计 算 机 还 得 先 找到 索引 1 的 结 点 ("blue" ),， 让 结 点 1 的 链 指向 新 的 
结 点 。 这 个 过 程 就 是 之 前 所 说 的 读 取 链表 ， 其 效率 为 O(N)。 下 面 我 们 来 演示 一 下 。 


因为 新 结 点 是 加 在 索引 1 之后， 所 以 计算 机 要 先 找 出 索引 1。 这 得 从 第 一 个 结 点 开始 。 


[we| 


接着 通过 第 一 个 链 访问 下 一 个 结 点 。 


"me -7 


既然 已 到 达 索 引 1 的 结 点 ， 那 就 可 以 增加 新 的 结 点 进去 了 。 


“| 1 


刚才 添加 "purple" 的 例子 花 了 3 步 。 若 想 将 它 添加 到 链表 的 末尾 ， 就 得 花 5 步 : 先是 用 4 
步 跳 到 索引 3 上 ， 再 用 1 步 插入 新 绪 点 。 

因此 ， 链 表 的 插入 效率 为 O(N)， 与 数组 一 样 。 

有 趣 的 是 , 通过 以 上 分 析 , 你 会 发 现 链表 的 最 坏 情况 和 最 好 情况 与 数组 刚好 相反 。 在 链表 开 
头 插入 很 方便 , 在 数组 开头 搬入 却 很 麻烦 ; 在 数组 的 末尾 插入 是 最 好 情况 , 在 链表 的 末尾 插入 却 
是 最 坏 情况 。 总 结 起 来 如 下 表 所 示 。 





































































































基于 结 点 的 数据 结构 














场 景 数 组 链 表 
在 前 端 插入 最 坏 情 况 最 好 情况 
在 中 间 插 和 F 均 情况 平均 情况 
在 末端 插入 最 好 情况 最 坏 情况 





下 面 给 LinkedList 类 加 上 插入 方法 。 


class LinkedList 





attr_accessor :first node 


# 其 他 方法 略 …… 


def insert at index(index, value) 


人 ## 创建 新 结 点 


new_node = Node.new(value) 


# 如 果 在 开头 插入 ， 则 将 新 结 点 的 next_node 指向 原 first_node， 


人 ## 并 为 其 设置 新 的 first_node 


if index == 
new_node .next_node 
return @first node 
end 


first node 
= new_node 


current node = first node 


current index = 0 


杂 先 找 出 新 结 点 插入 位 置 前 


prev_index = index - 


的 那 一 结 点 
1 


while current index < prev index do 
current node = current node.next node 


current index += 1 
end 


new_ node.next node = 


# 使 前 一 结 点 的 链 指 向 新 结 


current node.next node 


点 


current node.next node = new node 


end 


end 


11.6 ”删除 


从 效率 上 来 看 ， 删 除 跟 所 




















链表 的 first_node 设置 成 当前 的 第 二 个 结 点 。 


回 到 "once" 、"upon"、"a" 和 "time" 的 例子 。 如 果 要 删除 "once" ， 那 直接 让 链表 以 "upon" 


为 开头 就 好 了 。 





入 是 相似 的 。 如 果 删 除 的 是 链表 的 第 

















一 个 结 , 


点 


SX) 





那 就 只 要 1 步 : 将 
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list.first node = node 2 
再 回想 删除 数组 的 第 一 个 元 素 时 ,得 把 剩余 的 所 有 元 素 左 移 一 格 , 需要 O(V) 的 时 间 复 杂 度 。 


删除 链表 的 最 后 一 个 结 点 , 其 实际 的 删除 动作 只 需 1 步 一 一 令 倒 数 第 二 的 结 点 的 链 指 向 null。 
然而 ， 要 找 出 倒数 第 二 的 结 点 ， 得 花 入 步 ， 因 为 我 们 依然 只 能 从 第 一 个 结 点 顺 着 链 往 下 一 个 个 
地 找 。 


下 面 这 个 表格 对 比 了 各 种 情况 下 数组 和 链表 删除 操作 的 效率 。 注意 它 跟 插 入 效率 的 表格 几乎 
一 模 一 样 。 
































场景 数 ”组 链表 

在 前 端 删除 最 坏 情况 最 好 情况 

在 中 间 删 除 平均 情况 平均 情况 

在 末端 删除 最 好 情况 最 坏 情况 
要 在 链表 中 间 做 删除 , 计算 机 需要 修改 被 删 结 点 的 前 一 结 点 的 链 ,看 下 面 的 例子 你 就 会 明白 。 


假设 现在 要 删除 刚才 例子 的 索引 2 的 值 ("purpte" )， 计 算 机 就 会 找 出 索引 1 的 结 点 , 将 其 
链 指向 "green" 结 点 。 


“| 7 








“| 


LinkedList 类 的 删除 操作 实现 如 下 。 


class LinkedList 
attr_accessor :first node 
# 其 他 方法 略 …… 


def delete at index(index) 

# 如 果 删 除 的 是 第 一 个 结 点 ， 

# 则 将 first_node 重 置 为 第 二 个 结 点 ， 

# 并 返回 原 第 一 个 结 点 

if index == 
deleted node = first node 
@first node = first node.next node 
return deleted node 

end 


current node = first node 
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current index = 0 


人 ## 先 找 出 被 删 结 点 前 的 那 一 结 点 ， 

# 将 其 命名 为 Current_node 

while current index < index - 1 do 
current node = current node.next node 
current index += 1 

end 


玉 再 找 出 被 删 结 点 后 的 那 一 结 点 
deleted node = current node.next node 
node after deleted node = deleted node.next node 


# 将 Current_node 的 链 指 向 node_after_deleted node,， 
人 # 这 样 被 删 结 点 就 被 排除 在 链表 之 外 了 

current node.next node = node after deleted node 
deleted node 


end 


end 


经 过 一 番 分 析 ， 链 表 与 数组 的 性 能 对 比如 下 所 示 。 





操作 数 ”组 链 表 
读 取 0O(1) O(N) 
查找 OU) O(N) 
插入 O(N) (在 末端 是 0(1) ) O(N) (在 前 端 是 0(1) ) 
| 除 O(N) (在 末端 是 0(1) ) O(N) (在 前 端 是 0(1) ) 











尽管 两 者 的 查找 、 插 入 、 删 除 的 效率 看 起 来 差不多 


既然 如 上 


11.7 





上 ， 那 为 什么 还 要 用 链表 呢 ? 


链表 实战 








， 但 在 读 取 方 面 ， 数 组 比 链表 要 快 得 多 。 


高 效 地 遍历 单个 列表 并 删除 其 中 多 个 元 素 , 是 链表 的 亮点 之 一 。 假设 我 们 正在 写 一 个 整理 电 
子 邮 件 地 址 的 应 用 ， 它 会 删 掉 列表 中 无 效 格式 的 地 址 。 具 体 算法 是 ,每 次 读 取 一 个 地 址 ， 然 后 用 
正则 表达 式 〈 一 种 用 于 识别 数据 格式 的 特定 模式 ) 来 校 验 其 有 效 性 。 如 果 发 现 该 地 址 无 效 ， 就 将 
它 从 列表 中 移 除 。 
不 管 这 个 列表 是 数组 还 是 链表 , 要 检查 每 个 元 素 的 话 ， 都 得 花 X 步 。 然 而 ， 当 要 删除 邮件 地 
址 时 ， 它 们 的 效率 却 不 同 ， 下 面 我 们 来 验证 一 下 。 


用 数组 的 话 ， 每 次 删除 由 












































除 所 产生 的 空 际 。 而 且 还 必须 完成 这 些 平移 才能 执行 下 


8 件 地 址 ， 我 们 就 要 另外 再 花 O(N) 步 去 左 移 后 面 的 数据 ， 以 填补 删 











次 邮件 地 址 的 检查 。 
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所 以 如 果 存 在 需要 删除 的 无 效 地 址 ， 那么 除了 遍历 邮件 地 址 的 N 步 ， 还 得 加 上 N 步 乘 以 无 
效 地 址 数 。 


假设 每 10 个 地 址 就 有 1 个 是 无 效 的 。 如 果 列 表 包 含 1000 个 地 址 ， 那 么 无 效 的 就 应 该 会 有 
100 个 。 于 是 我 们 的 算法 就 要 花 1000 步 来 读 取 ， 再 加 上 删除 所 带 来 的 大 约 100 000 步 的 操作 
( 100 个 无 效 地 址 x N )。 

但 要 是 链表 的 话 ， 每 次 删除 只 需 1 步 就 好 ， 因 为 只 需 改 动 结 点 中 链 的 指向 ， 然 后 就 可 以 继续 
仿 查 下 一 邮件 地 址 了 。 按 这 种 算法 去 处 理 1000 个 邮件 地 址 ， 只 需要 1100 步 (1000 步 读 取 和 100 
步 删 除 )。 
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链表 的 另 一 个 引 人 注 目的 应 用 , 就 是 作为 队列 的 底层 数据 结构 。 第 8 章 我 们 已 经 介绍 过 队列 ， 
你 应 该 还 记得 它 就 是 一 种 只 能 在 末尾 插入 元 素 , 在 开头 删除 元 素 的 数据 结构 。 当 时 我 们 用 数组 作 
为 队列 的 底层 ， 并 解释 说 队列 只 是 有 约束 条 件 的 数组 。 其 实 ， 改 用 链表 来 做 队列 的 底层 也 可 以 ， 
同样 地 ， 只 要 使 该 链表 的 元 素 只 在 未 尾 搬入 ,并 在 开头 删除 就 好 了 。 那么 用 链表 来 代替 数组 有 什 
么 好 处 呢 ? 下 面 来 分 析 一 下 。 

再 强调 一 次 ， 队 列 插 入 数据 只 能 在 末尾 。 如 上 文 所 述 , 在 数组 的 末尾 插入 是 极 快 的 ， 时 间 复 
杂 度 为 0(1)。 链 表 则 要 O(N)。 所 以 在 插入 方面 ， 选 择 数组 比 链表 更 好 。 

但 到 了 删除 的 话 ， 就 是 链表 更 快 了 了， 因为 它 只 要 0(1)， 而 数组 是 O(N)。 

基于 以 上 分 析 ， 似 乎 用 数组 还 是 链表 都 无 所 谓 。 因 为 它们 总 有 一 种 操作 是 0(1)， 另 一 种 是 
O(N): 数组 的 插入 是 0(1)， 删 除 是 O(N); 链表 则 反 过 来 ,分别 是 OO 和 0(1)。 

然而 ， 要 是 采用 双向 链表 这 一 链表 的 变种 ， 就 能 使 队列 的 插入 和 删除 都 为 0(1)。 

双向 链表 跟 链表 差不多 ,只 是 它 每 个 结 点 都 含有 两 个 链 一 一 一 个 指向 下 一 结 点 , 男 一 个 指向 
前 一 结 点 。 此 外 ， 它 还 能 直接 访问 第 一 个 和 最 后 一 个 结 点 。 


以 下 是 一 个 双向 链表 。 








































































































1 个 


第 一 个 结 点 指向 前 一 指向 下 一 最 后 一 个 结 点 
结 点 的 链 结 点 的 链 


用 代码 来 表述 的 话 ， 如 下 所 示 。 
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class Node 
attr_accessor :data, :next node, :previous node 
def initialize(data) 
@data = data 
end 
end 
class DoublyLinkedList 
attr_accessor :first node, :last node 
def initialize(first node=nil, last node=nil) 
@first node = first node 
@last node = last node 


end 


end 


由 于 双向 链表 总 会 记 住 第 一 个 和 最 后 一 个 结 点 , 因此 能 够 一 步 ( 以 0(1) 的 时 间 ) 访问 到 它们 。 
更 进一步 地 ， 在 末尾 插入 数据 也 可 以 一 步 完 成 ， 如 下 所 示 。 











这 里 创建 了 一 个 新 结 点 ("Sue" )， 并 使 其 previous node 指向 双向 链表 的 Last_node 
("Greg" )。 然 后， 再 将 Last_node ( "Greg" ) 的 next_node 指向 这 个 新 结 点 ("Sue" )。 最 后 ， 
把 Last_node 改 为 新 结 点 ("Sue" )。 

以 下 是 在 双向 链表 中 实现 的 新 方法 insert_at_end。 


class DoublyLinkedList 








attr_accessor :first node, :last node 


def initialize(first node=nil, last node=nil) 
@first node = first node 
@last node = last node 

end 


def insert at end(value) 
new node = Node.new(value) 


人 ## 如 果 链 表 还 没有 任何 结 点 

if !first node 
@first node = new node 
@last node = new node 
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else 
new_node.previous node = @last node 
@last node.next node = new node 
@last node = new node 
end 
end 


end 


因为 双向 链表 能 直接 访问 前 端 和 末端 的 结 点 , 所 以 在 两 端 插入 的 效率 都 为 0(1), 在 两 端 删除 
的 效率 也 为 0(1)。 由 于 在 末尾 插入 和 在 开头 删除 都 能 在 0(1) 的 时 间 内 完成 ， 因 此 拿 双 向 链表 作 
为 队列 的 底层 数据 结构 就 最 好 不 过 了 。 

以 下 是 基于 双向 链表 的 队列 的 完整 代码 示例 。 


class Node 























attr_accessor :data, :next node, :previous node 


def initialize(data) 
@data = data 
end 


end 
class DoublyLinkedList 
attr_accessor :first node, :last node 


def initialize(first node=nil, last node=nil) 
@first node = first node 
@last node = last node 

end 


def insert at end(value) 
new node = Node.new(value) 


# 如 果 链 表 还 没有 任何 结 点 

if !first node 
@first node = new node 
@last node = new node 

else 
new_node.previous node = @last node 
@last node.next node = new node 
@last node = new node 

end 

end 





def remove from front 
removed node = @first node 
@first node = @first node.next node 
return removed node 

end 
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end 


class Queue 
attr_accessor :queue 


def initiaLize 
@queue = DoubLyLinkedList.new 
end 


def enque(value) 
@queue.insert at end(value) 
end 


def deque 
removed node = @queue.remove from front 
return removed node.data 

end 


def tail 
return @Qqueue.last node.data 
end 


尽管 目前 还 没 用 到 队列 , 或 者 用 了 数组 但 没 用 双向 链表 也 运行 得 很 好 。 但 是 现在 , 你 知道 了 
还 有 其 他 选择 ， 也 学 习 了 什么 时 候 应 该 做 出 什么 选择 。 
你 学 会 了 在 特定 情况 下 使 用 链表 来 改善 性 能 。 后 面 还 会 介绍 更 复杂 的 基于 结 点 的 数据 结构 ， 
它们 更 常用 ,并且 对 性 能 的 提升 更 大 。 























让 一 切 操作 都 更 快 的 三 叉 树 








第 2 章 介 绍 了 二 分 查找 这 一 概念 ， 并 演示 了 当 数 组 有 序 时 ， 运 用 二 分 查找 就 能 以 O(log 入) 的 
时 间 复 杂 度 找 出 任意 值 的 所 在 位 置 。 可 见 ， 有 序 的 数组 是 多 么 美好 。 
但 是 有 序数 组 存在 着 另 一 个 问题 。 
有 序数 组 的 插入 和 删除 是 缓慢 的 。 往 有 序数 组 中 插入 一 个 值 前 ,你 得 将 所 有 大 于 它 的 元 素 右 
移 一 格 。 从 有 序数 组 中 删除 一 个 值 后 ， 你 得 将 所 有 大 于 它 的 元 素 左 移 一 格 。 最 坏 情况 下 ( 插 和 人 或 
删除 发 生 在 数组 开头 ) 这 会 需要 N 步 ,平均 情况 则 是 W/ 2 步 。 不 管 怎样 ， 都 是 O(N) 的 效率 ， 而 
O(LV) 算 是 挺 慢 的 。 


后 来 , 在 第 7 章 我 们 学 到 了 散 列 表 能 以 0(1) 的 效率 进行 查找 、 插 入 和 删除 , 但 它 又 有 另 一 明 
显 的 不 足 : 不 保持 顺序 。 


既 要 保持 顺序 ， 又 要 快速 查找 、 插 和 信和 删除 ， 看 来 有 序数 组 和 散 列 表 都 不 行 。 那 还 有 什么 数 
据 结构 可 以 选择 ? 


看 看 二 义 树 吧 。 

































































12.1 二 又 树 


上 一 章 我 们 通过 链表 见识 了 基于 结 点 的 数据 结构 。 一 个 普通 的 链表 里 ， 每 一 个 结 点 会 包含 一 
个 连接 自身 和 另 一 结 点 的 链 。 树 也 是 基于 结 点 的 数据 结构 , 但 树 里 面 的 每 个 结 点 , 可 以 含有 多 个 
链 分 别 指向 其 他 多 个 结 点 。 


以 下 是 一 棵 典型 的 树 。 
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此 例 中 ， 每 个 结 点 链接 着 另外 两 个 结 点 。 简 单 起 见 ， 我 们 也 可 以 不 用 画 出 存储 链 的 格子 。 








j 
2 ~ 
es 
“gr 计 wt ~ we 
谈论 树 的 时 候 ， 我 们 会 用 到 以 下 术语 。 
口 最 上 面 的 那 一 结 点 〈 此 例 中 的 “j”) 被 称 为 根 。 是 的 ， 图 中 的 根 位 于 树 的 顶端 ， 请 自行 





口 此 例 中 ，“j” 是 “m” 和 “b” 的 父 结 点 ， 反 过 来 ,“m” 和 “b” 是 “j” 的 子 结 点 。 
又 是 “gq” 和 2 的 父 结 点 “gq” 和 “7” 是 “mm” 的 子 结 点 
口 树 可 以 分 层 。 此 例 中 的 树 有 3 层 。 


本 
m 











"q" bz i Wey < 第 三 层 

















基于 树 的 数据 结构 有 很 多 种 , 但 本 章 只 关注 其 中 一 种 一 一 二 叉 树 。 二 叉 树 是 一 种 遵守 以 下 规 
则 的 树 。 


口 每 个 结 点 的 子 结 点 数量 可 为 0、1、2。 
口 如 果 有 两 个 子 结 点 ， 则 其 中 一 个 子 结 点 的 值 必须 小 于 父 结 点 ， 另 一 个 子 结 点 的 值 必须 大 于 


Dio) 











以 下 是 一 个 二 叉 树 的 例子 ， 其 中 结 点 的 值 是 数字 。 
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50 
~ 
A / 
10 33 56 89 
人 A 
411 30 40 52 61 82 95 
注意 ， 小 于 父 结 点 的 子 结 点 用 左 箭头 来 表示 ， 大 于 父 结 点 的 子 结 点 则 用 右 箭 头 来 表示 。 
尽管 下 图 是 一 棵 树 ， 但 它 不 是 二 又 树 。 
50 


20 30 
之 所 以 不 是 二 义 树 ,是 因为 它 的 两 个 子 结 点 的 值 都 小 于 父 结 点 。 
以 Python 来 实现 一 个 树 结 点 的 话 ， 大 概 是 这 样 : 


class TreeNode: 
def init (self,val,left=None,right=None): 
self.value = val 
self.leftChild = left 
self.rightChild = right 


然后 就 可 以 用 它 来 构建 一 棵 简单 的 树 了 。 


node = TreeNode(1) 
node2 = TreeNode(10) 
root = TreeNode(5, node, node2) 


因为 二 叉 树 具有 这 样 独特 的 结构 ,所 以 我 们 能 在 其 中 非常 快速 地 进行 查找 操作 ,下面 就 来 看 看 。 





























12.2 ”查找 
这 是 一 棵 二 又 树 。 
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二 叉 树 的 查找 算法 先 从 根 结 点 开始 。 
(1) 检视 该 结 点 的 值 。 
(2) 如 果 正 是 所 要 找 的 值 ， 太 好 了 ! 
(3) 如 果 要 找 的 值 小 于 当前 结 点 的 值 ， 则 在 该 结 点 的 左 子 树 查 找 。 
(4) 如 果 要 找 的 值 大 于 当前 结 点 的 值 ， 则 在 该 结 点 的 右 子 树 查找 。 
以 下 是 用 Python 写 的 递归 式 查找 。 
def search(value, node): 
# 基准 情形 :如 果 node 不 存在 
# 或 者 node 的 值 符合 


if node is None or node.value == value: 
return node 











# 如 果 Value 小 于 当前 结 点 ， 那 就 从 左 子 结 点 处 查找 
elif value < node.value: 

return search(value, node.leftChild) 
# 如 果 value 大 于 当前 结 点 ， 那 就 从 右 子 结 点 处 查找 
else: # value > node.value 

return search(value, node.rightChild) 


假设 现在 我 们 要 找 61， 那 来 看 看 整个 过 程 要 人 花 多 少 步 。 


树 的 查找 必须 从 根 开始 。 
内 
A / 
10 33 56 89 


x WN AN 


4113040 5261 82 95 


接着 , 计算 机 会 问 自己 : 我 们 要 找 的 值 与 该 结 点 的 值 相 比 ， 是 大 还 是 小 呢 ? 如 果 小 于 当前 结 
点 ， 那 就 在 左 子 结 点 上 找 。 如 果 大 于 当前 结 点 ， 那 就 在 右 子 结 点 上 找 。 


本 例 中 ， 因 为 61 大 于 50， 所 以 它 只 能 在 树 的 右 侧 ， 于 是 我 们 检查 右 子 结 点 。 
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算法 继续 检查 该 结 点 的 值 。 因 为 75 不 是 我 们 要 找 的 61, 所 以 还 得 往 下 一 层 找 。 由 于 61 小 于 
75， 它 只 能 在 75 的 左 侧 ， 于 是 下 一 步 去 的 是 左 子 结 点 。 
50 
Fn 
25 25 
3 89 
yy Vs VAV 
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因为 61 大 于 56， 所 以 到 56 的 右 子 结 点 上 找 。 


50 
ci 
25 
A 和 \ 
区 


4 11 30 40 区 E82 95 


在 这 棵 树 里 找 出 61， 我 们 总 共用 了 4 步 。 


推广 开 来 ,我 们 会 说 二 又 树 查 找 的 时 间 复 杂 度 是 O(log W)。 因 为 每 行进 一 步 ， 我 们 就 把 剩余 的 
结 点 排除 了 一 半 《〈 不 过 很 快 就 能 看 到 ， 只 在 最 好 情况 下 ， 即 理想 的 平衡 二 又 树 才 有 这 样 的 效率 )。 


再 与 二 分 查找 比较 ， 它 也 是 每 次 尝试 会 排除 一 半 可 能 性 的 O(log 入 ) 算 法 ,可 见 二 又 树 查 找 跟 
有 序数 组 的 二 分 查找 拥有 同样 的 效率 。 
要 说 二 又 树 哪里 比 有 序数 组 更 亮 眼 ， 那 应 该 是 插入 操作 。 
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12.3 插入 


要 探索 二 叉 树 插入 的 算法 ,我 们 还 是 从 一 个 实例 入 手 吧 。 假设 现在 要 往 刚 才 的 树 里 插入 45。 
首先 要 做 的 就 是 找 出 45 应 该 被 链接 到 哪个 结 点 上 。 先 从 根 开始 找 起 。 


内 
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因为 45 小 于 50， 所 以 我 们 转 到 左 子 结 点 上 。 
50 
~ 
10' .33 
A 
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为 45 大 于 25， 所 以 我 们 检查 右 子 结 点 。 


50 
x NN 
这 5 75 
FY v 
10 56 
XX PAT AN 


41130 40 5261 82 95 
45 大 于 33， 所 以 检查 33 的 右 子 结 点 。 


ja J 32 61 Ye 
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至 此 ， 我 们 到 达 了 一 个 没有 子 结 点 的 结 点 ， 也 就 无 法 再 往 下 了 。 这 意味 着 可 以 做 搬入 了 。 
为 45 大 于 40， 所 以 将 其 作为 40 的 右 子 结 点 来 插入 。 
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10 33 56 89 
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在 这 个 例子 里 , 插入 花 了 5 步 , 包括 4 步 查找 和 1 步 插入 ,插入 这 1 步 总 是 发 生 在 查找 之 后 ， 
所 以 总 共 log N+1 步 。 按 照 忽略 常数 的 大 O 来 说 ， 就 是 O(log 和 N) 步 。 

有 序数 组 的 插入 则 是 O(N)， 因 为 该 过 程 中 除了 查找 ， 还 得 移动 大 量 的 元 素来 给 新 元 素 腾 出 
空间 。 

这 就 是 二 又 树 的 高 效 之 处 。 有 序数 组 查找 需要 O(log 和 N), 插入 需要 O(N), 而 二 又 树 都 是 只 要 
O(log N)。 当 你 估计 应 用 会 发 生 许多 数据 改动 时 ， 这 一 比较 将 有 助 你 做 出 正确 选择 。 

以 下 是 二 又 树 插入 的 Python 实现 ， 它 跟 search 一 样 都 是 递归 的 。 


def insert(value, node): 
if value < node.value: 



































## 如 果 左 子 结 点 不 存在 ， 则 将 新 值 作为 左 子 结 点 
if node.leftChild is None: 
node.leftChild = TreeNode(value) 
else: 
insert(value, node.leftChild) 


elif value > node.value: 


# 如 果 右 子 结 点 不 存在 ， 则 将 新 值 作为 右 子 结 点 
if node.rightChild is None : 
node.rightChild = TreeNode(vaLue) 
else: 
insert(value, node.rightChild) 


注意 , 只 有 用 随意 打 乱 的 数据 创建 出 来 的 树 才 有 可 能 是 比较 平衡 的 。 要 是 插入 的 都 是 已 排序 
的 数据 ， 那 么 这 棵 树 就 失衡 了 ， 它 用 起 来 也 会 比较 低 效 。 比 如 说 ， 按 顺序 插入 1、2、3、4、5 的 
话 ， 得 出 的 树 就 会 是 这 样 。 
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从 中 查找 5， 效率 会 是 O(N)。 
但 要 是 按 3、2、4、1、5 的 顺序 来 插入 的 话 ， 得 出 的 树 就 是 平衡 的 。 








YY 
2 4 
yy 








因此 ,假若 你 要 用 有 序数 组 里 的 数据 来 创建 二 又 树 ， 最 好 先 把 数据 洗 乱 。 


在 完全 失衡 的 最 坏 情况 下 , 二叉树 的 查找 需要 O(N)。 在 理想 平衡 的 最 好 情况 下 , 则 是 O(log N)。 
在 数据 随机 插入 的 一 般 情况 下 ， 因 为 树 也 大 人 臻 平衡， 所 以 查询 效率 也 大 约 是 O(log N)。 




















12.4 删除 
删除 是 二 叉 树 的 各 种 操作 中 最 麻烦 的 一 个 ,必须 考虑 周全 才 好 动手 。 假设 现在 要 删除 这 棵 二 


叉 树 中 的 4。 
ON 
y 、 / 


人 AN yy AN 


4 11 30 46 52 61 82 95 
首先 ， 我 们 查找 出 它 所 在 的 结 点 ， 然 后 一 步 将 该 结 点 删 掉 。 

















10 
A AN 


Wy 
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这 看 起 来 好 像 很 简单 ， 那 我 们 再 试 试 删 掉 10 吧 。 


VN 


11 30 40 52 61 82 95 


如 果 删 掉 10 的 话 ， 就 会 导致 11 的 那个 结 点 从 树 上 脱离 。 当 然 这 是 不 允许 的 ， 否 则 这 个 11 
就 永远 都 找 不 到 了 。 好 在 我 们 还 有 解决 办 法 : 将 11 放 到 之 前 10 所 在 的 位 置 。 





红 11E 33 
TAN AANA 


30 40 52 61 82 95 





至 此 ， 删 除 操作 遵循 以 下 规则 。 
口 如 果 要 删除 的 结 点 没有 子 结 点 ， 那 直接 删 掉 它 就 好 。 


口 如 果 要 删除 的 结 点 有 一 个 子 结 点 ， 那 删 掉 它 之 后 ， 还 要 将 子 结 点 填 到 被 删除 结 点 的 位 
置 上 。 


要 删除 带 有 两 个 子 结 点 的 结 点 是 最 复杂 的 。 比 如 说 现在 要 删除 56。 


























11 33 哆 89 
类 以 a 


30 40 52 61 82 95 








那 52 和 61 要 怎么 处 理 呢 ? 显然 不 能 将 它们 都 放 到 56 原本 的 位 置 上 ， 还 需要 第 三 条 规则 。 


口 如 果 要 删除 的 结 点 有 两 个 子 结 点 ， 则 将 该 结 点 替换 成 其 后 继 结 点 。 一 个 结 点 的 后 继 结 点 ， 
就 是 所 有 比 被 删除 结 点 大 的 子 结 点 中 ， 最 小 的 那个 。 
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上 面 这 句 话 听 起 来 有 点 绕 。 或 者 你 把 这 些 结 点 按 顺 序 排 好 , 那么 每 个 结 点 后 续 的 那个 结 点 就 
是 其 后 继 结 点 。 就 像 本 例 中 56 的 所 有 后 裔 中 ， 只 有 61 能 被 称 为 其 后 继 结 点 。 按 照 这 个 规则 ,我 
们 将 56 替换 成 61。 
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全 人 
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30 40 52 82 95 
那 计算 机 是 怎么 找 出 后 继 结 点 的 呢 ? 这 是 有 算法 可 循 的 。 


跳 到 被 删除 结 点 的 右 子 结 点 ， 然 后 一 路 只 往 左 子 结 点 上 跳 , 直到 没有 左 子 结 点 为 止 ， 则 所 停 
留 的 结 点 就 是 被 删除 节点 的 后 继 结 点 。 


再 来 看 一 个 更 复杂 的 删除 ， 这 次 我 们 删除 根 结 点 。 








AN YX 
30 40 52 82 95 
现在 需要 找 后 继 结 点 来 填补 根 的 位 置 。 








首先 ,访问 右 子 结 点 ， 然 后 一 路 往 左 下 方向 移 步 ， 直 至 没有 左 子 结 点 的 结 点 上 。 
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这 就 找 出 后 继 结 点 52 了 ， 接 着 我 们 将 其 填 到 被 删除 结 点 的 位 置 上 。 
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删除 完成 ! 
然而 ,还 有 一 种 情况 我 们 没 遇 到 过 , 那 就 是 后 继 结 点 带 有 右 子 结 点 。 证 我 们 回 到 根 被 删除 之 





前 的 状态 ， 并 且 给 52 加 上 一 个 右 子 结 点 。 


"4 2 


25 49 
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We 这- 人 
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55 地 一 新 的 右 子 结 点 
R 那 里 了 ， 因 为 这 样 会 使 其 子 结 点 55 悬空 。 于 是 ， 











如 此 一 来 ， 就 不 能 只 将 后 继 结 点 52 移 到 
我 们 再 加 一 条 关于 删除 的 规则 。 
口 如 果 后 继 结 点 带 有 右 子 结 点 ， 则 在 后 继 结 点 
继 结 点 的 父 节点 的 左 子 结 点 。 


下 面 运行 一 遍 这 个 流程 。 


首先 ， 将 后 继 结 点 填 到 根 处 。 





补 被 删除 结 点 以 后 ， 用 此 右 子 结 点 替代 后 











泗 
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< 一 悬空 的 子 结 点 


此 时 55 便 悬 在 半空 中 了 。 接 下 来 ， 将 55 转换 为 继承 节点 的 父 节 点 的 左 子 节点 ， 本 例 中 ， 








61 是 继承 结 点 的 父 结 点 ， 所 以 55 成 为 61 的 左 子 结 点 。 
52 
25 
11 33 
YX > 
30 403 
这 才 算 真正 完成 了 。 





以 下 为 二 又 树 的 删除 算法 的 所 有 规则 。 
口 如 果 要 删除 的 结 点 没有 子 结 点 ， 那 直接 删 掉 它 就 好 。 
口 如 果 要 删除 的 结 点 有 一 个 子 结 点 ， 那 删 掉 它 之 后 ， 还 要 将 子 结 点 填 到 被 删除 结 点 的 位 
置 上 。 
口 如 果 要 删除 的 结 点 有 两 个 子 结 点 ， 则 将 该 结 点 替换 成 其 后 继 结 点 。 一 个 结 点 的 后 继 结 点 ， 
就 是 所 有 比 被 删除 结 点 大 的 子 结 点 中 ， 最 小 的 那个 。 
于 如 果 后 继 结 点 带 有 右 子 结 点 ， 则 在 后 继 结 点 填补 被 删除 结 点 以 后 ， 用 此 右 子 结 点 蔡 代 
后 继 结 点 的 父 节点 的 左 子 结 点 。 
以 下 是 用 Python 写 的 二 又 树 递归 式 删 除 算法 。 为 了 易于 理解 ， 安 插 了 一 些 注 释 进 去 。 


def delete(valueToDelete, node): 



























































人 ## 当前 位 置 的 上 一 层 无 子 结 点 ， 已 到 达 树 的 底层 ， 即 基准 情形 
if node is None: 
return None 
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# 如 果 要 删除 的 值 小 于 (或 大 于 ) 当前 结 点 ， 

# 则 以 左 子 树 (或 右 子 树 ) 为 参数 ， 递 归 调 用 本 方法 ， 

# 然后 将 当前 结 点 的 左 链 (或 右 链 ) 指向 返回 的 结 点 

elif valueToDelete < node.value: 
node.leftChild = delete(valueToDelete, node.leftChild) 
# 将 当前 结 点 (及 其 子 树 ， 如 果 存 在 的 话 ) 返回 ， 
# 作为 其 父 结 点 的 新 左 子 结 点 (或 新 右 子 结 点 ) 
return node 

elif valueToDelete > node.value: 
node.rightChild = delete(valueToDelete, node.rightChild) 
return node 


# 如 果 要 删除 的 正 是 当前 结 点 
elif valueToDelete == node.value: 


人 # 如 果 当 前 结 点 没有 左 子 结 点 ， 
# 则 以 右 子 结 点 (及 其 子 树 ， 如 果 存 在 的 话 ) 替换 当前 结 点 成 为 当前 结 点 之 父 结 点 的 新 子 结 点 
if node.leftChild is None: 

return node.rightChild 


# 如 果 当 前 结 点 没有 左 子 结 点 ， 也 没有 右 子 结 点 ， 那 这 里 就 是 返回 None 


elif node.rightChild is None: 
return node.leftChild 


# 如 果 当 前 结 点 有 两 个 子 结 点 ， 则 用 Lift 函数 ( 见 下方 ) 来 做 删除 ， 
# 它 会 使 当前 结 点 的 值 变 成 其 后 继 结 点 的 值 
else: 
node.rightChild = lift(node.rightChild, node) 
return node 


def lift(node, nodeToDelete): 


人 # 如 果 此 函数 的 当前 结 点 有 左 子 结 点 ， 

# 则 递归 调用 本 函数 ， 从 左 子 树 找 出 后 继 结 点 

if node.leftChild: 
node.leftChild = lift(node.leftChild, nodeToDelete) 
return node 

人 # 如 果 此 函数 的 当前 结 点 无 左 子 结 点 ， 

# 则 代表 当前 结 点 是 后 继 结 点 ， 于 是 将 其 值 设置 为 被 删除 结 点 的 新 值 


elLse 
nodeToDelete.value = node.value | 
# 用 后 继 结 点 的 右 子 结 点 替代 后 继 结 点 的 父 节 点 的 左 子 结 点 


return node.rightChild 


跟 查 找 和 插入 一 样 ， 平 均 情况 下 二 义 树 的 删除 效率 也 是 O(log N)。 因 为 删除 包括 一 次 查找 ， 
以 及 少量 额外 的 步 又 去 处 理 悬 空 的 子 结 点 。 有 序数 组 的 删除 则 由 于 需要 左 移 元 素 去 填补 被 删除 元 
素 产 生 的 空隙， 最 终 导致 O(N) 的 时 间 复 杂 度 。 
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12.5 “二叉树 实战 


二 又 树 在 查找 、 搬 入 和 删除 上 引 以 为 做 的 O(log 和 N) 效 率 ,使 其 成 为 了 存储 和 修改 有 序数 据 的 
一 大 利器 。 它 尤其 适用 于 需要 经 常 改动 的 数据 , 虽然 在 查找 上 它 跟 有 序数 组 不 相 伯 仲 , 但 在 插入 
和 删除 方面 ， 它 迅速 得 多 。 
比如 说 你 正在 做 一 个 书目 维护 的 应 用 ， 它 需要 具备 以 下 功能 。 

口 该 应 用 可 以 将 书 名 依照 字母 序 打印 。 
口 该 应 用 可 以 持续 更 新 书目 。 
口 该 应 用 可 以 让 用 户 从 书目 中 搜索 书 名 。 

如 果 你 预期 该 书目 不 常 变动 的 话 , 那么 用 有 序数 组 作为 存储 结构 是 可 以 的 。 但 这 个 应 用 偏偏 
要 经 常 实时 更 新 数据 。 要 是 其 中 包含 上 百 万 册 图 书 ， 那 还 是 用 二 又 树 来 保存 比较 好 。 


存储 书 名 的 二 又 树 大 概 是 下 面 这 个 样子 。 
































"Moby Dick" 
"Great "Robinson 
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书 名 的 搜索 和 更 新 , 可 以 按 我 们 之 前 介绍 的 二 又 树 查 找 、 插 入 和 删除 来 解决 。 但 依照 字母 序 
打印 书 名 该 怎么 做 呢 ? 
首先 , 我们 得 学 会 如 何 访问 树 上 的 所 有 结 点 。 访 问 数据 结构 中 所 有 元 素 的 过 程 ， 叫 作 遍 历数 
据 结构 。 
接着 , 为 了 使 书 名 以 字母 序 打印 , 我们 得 确保 遍历 也 是 以 字母 序 进行 。 虽然 有 多 种 方法 可 以 
遍历 树 ， 但 对 于 这 个 要 求 字 母 序 打印 的 应 用 ， 我 们 采用 中 序 遍 历 。 
递归 是 实施 中 序 遍 历 的 有 力 工 具 。 我 们 将 创建 一 个 名 为 traverse 的 递归 函数 ， 它 可 以 在 任 
一 结 点 上 调用 。 然 后 执行 以 下 步 又 。 
(1) 如 果 此 结 点 有 左 子 结 点 ， 则 在 左 子 结 点 上 调用 自身 (traverse )。 
(CO) 访问 此 结 点 〈 对 于 书目 应 用 来 说 ， 就 是 打印 结 点 的 值 )。 
(3) 如 果 此 结 点 有 右 子 结 点 ， 则 在 右 子 结 点 上 调用 自身 (traverse )。 
知 当 前 结 点 没有 子 结 点 ， 则 意味 着 该 递归 算法 到 达 了 基准 情形 ， 这 时 我 们 无 须 再 调用 
traverse， 只 需 打 印 结 点 中 的 书 名 就 行 了 。 
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在 “Moby Dick” 上 调用 traverse 的 话 ， 就 能 以 下 图 的 顺序 访问 树 上 的 所 有 结 点 。 
OD "Moby Dick" 
Ocreat (6)"Robinson 
Expectations" Crusoe" 
“ME x GX Gu 人 
"ALice in "Lord of "Pride and "The Odyssey" 
Wonderland" the Flies" Prejudice" 














这 样 就 能 依照 字母 序 打印 书目 了 。 遍历 会 访问 树 上 所 有 的 结 点 ， 所 以 树 的 遍历 效率 为 O(N)。 
以 下 是 用 Python 写 的 以 字母 序 打印 书目 的 traverse_and_print 函数 。 


def traverse and print(node): 
if node is None: 
return 
traverse and print(node.leftChild) 
print(node.value) 
traverse and print(node.rightChild) 




















12.6 总结 

二 义 树 是 一 种 强大 的 基于 结 点 的 数据 结构 ， 它 既 能 维持 元 素 的 顺序 ， 又 能 快速 地 查找 、 插 入 
和 删除 。 尽 管 比 它 的 近亲 链表 更 为 复杂 ,但 它 更 有 用 。 

值得 一 提 的 是 , 树 形 的 数据 结构 除了 二 义 树 以 外 还 有 很 多 种 ,包括 堆 、B 树 、 红 黑 树 、2-3-4 
树 等 。 它 们 也 各 有 自己 适用 的 场景 。 

下 一 章 , 我 们 还 会 遇见 另 一 种 基于 结 点 的 数据 结构 
应 用 的 核心 组 成 部 分 ， 强 大 上 且 灵活 。 














图 。 图 是 社交 网 络 和 地 图 软件 等 复杂 
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假设 我 们 正在 打造 一 个 像 Facebook 那样 的 社交 网 络 。 在 该 应 用 里 ， 大 家 可 以 加 别人 为 “ 朋 
友 ”。 这 种 朋友 关系 是 相互 的 ， 如 果 Alice 是 Bob 的 朋友 ,那么 Bob 也 会 是 Alice 的 朋友 。 


这 些 关 系数 据 要 怎么 管理 才 好 呢 ? 
一 种 简单 的 方法 是 ， 以 二 维 数组 来 保存 每 一 对 关系 。 








relationships = [ 
["Alice", "Bob"], 
["Bob", "Cynthia"], 
["Alice", "Diana"], 
["Bob", "Diana"], 
["Elise", "Fred"], 
["Diana", "Fred"], 
[ 


"Fred", "Alice"] 
] 


不 幸 的 是 ， 这 样 无 法 快速 地 知道 Alice 的 朋友 是 哪些 人 。 你 只 能 在 数组 里 按 逐 对 关系 检查 ， 
看 Alice 在 不 在 那 对 关系 中 。 在 检查 过 程 中 ， 你 还 得 创建 一 个 列表 来 暂 存 查 出 的 朋友 ( 此 例 中 有 
Bob、Diana 和 Fred )。 要 确定 Elise 是 否 为 Alice 的 朋友 ， 也 同样 得 逐 对 检查 。 

由 于 数据 以 这 种 结构 存储 ,和 若 想 查找 Alice 的 朋友 就 得 检查 数据 库 中 的 所 有 关系 , 需要 O(N) 
的 时 间 复 杂 度 。 

其 实 有 一 种 更 好 的 存储 方法 。 使 用 图 这 种 数据 结构 的 话 ， 我 们 可 以 在 0(1) 时 间 内 找 出 Alice 
的 所 有 朋友 。 


























13.1 





图 是 一 种 善于 处 理 关 系 型 数据 的 数据 结构 ， 使 用 它 可 以 很 轻松 地 表示 数据 之 间 是 如 何 关联 的 。 
下 图 是 我 们 的 Facebook 网 络 。 


每 个 人 都 是 一 个 结 点 ， 人 与 人 之 间 的 朋友 关系 则 以 线段 表示 。 按照 图 的 术语 来 说 , 每 个 结 点 
都 是 一 个 顶点 ,每 条 线段 都 是 一 条 边 。 当 两 个 顶点 通过 一 条 边 联系 在 一 起 时 , 我 们 会 说 这 两 个 顶 















































点 是 相 邻 的 。 


Bob 








图 的 实现 形式 有 很 多 ， 最 简单 的 方法 之 一 就 是 用 散 列表 (参见 第 7 章 ) 例如 ， 使 用 Ruby 
散 列 表 来 实现 一 个 极为 基础 的 社交 网 络 。 


friends = { 
"Alice" => ["Bob", "Diana", "Fred"], 
"Bob" => ["Alice", "Cynthia", "Diana"], 
"Cynthia" => ["Bob"], 
"Diana" => ["Alice", "Bob", "Fred"], 
"Elise" => ["Fred"], 
"Fred" => ["Alice", "Diana", "Elise"] 


上 


因为 从 散 列 表 里 查 找 一 个 键 所 对 应 的 值 只 需要 1 步 ， 所 以 查找 Alice 的 朋友 能 以 0(1) 的 时 间 
复杂 度 完 成 ， 如 下 所 示 。 


friends["Alice"] 





跟 Facebook 不 同 ，Twitter 里 面 的 关系 不 是 相互 的 。Alice 可 以 关注 Bob, 但 Bob 不 一 定 要 关 
注 Alice。 让 我 们 构造 一 个 新 的 图 来 表示 谁 关注 了 谁 。 








图 中 箭头 表示 了 关系 的 方向 。Alice 关注 了 Bob 和 Cynthia, 但 没有 人 关注 Alice。Bob 和 Cynthia 
互相 关注 。 

用 散 列 表 来 表示 的 话 ， 就 是 这 样 : 

foLLowees = { 


"Alice" => ["Bob", "Cynthia"], 
"Bob" => ["Cynthia"], 
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"Cynthia" => ["Bob"] 
} 


虽然 Facebook 跟 Twitter 的 例子 很 相似 ,但 它们 本 质 上 是 不 一 样 的 。Twitter 中 的 关系 是 单 向 
的 ， 我 们 也 在 图 中 用 箭头 表示 了 其 方向 ， 因 此 它 的 图 是 有 向 图 。Facebook 中 的 关系 则 是 相互 的 ， 
我 们 只 画 成 了 普通 的 线段 ， 它 的 图 是 无 向 图 。 

尽管 只 用 散 列 表 也 可 以 实现 一 个 图 ， 但 是 以 面向 对 象 的 方法 来 写 会 更 加 健壮 。 

以 下 便 是 一 种 更 为 健壮 的 实现 方式 ， 它 采用 的 语言 是 Ruby。 


class Person 
























































attr_accessor :name, :friends 


def initialize(name) 
Gname = name 
@friends = [] 

end 


def add friend(friend) 
@friends << friend 
end 


end 
有 了 这 个 Ruby 类 ， 我 们 就 可 以 创建 人 物 并 且 给 他 们 添加 朋友 了 。 


mary = Person.new("Mary") 
peter = Person.new("Peter") 





mary.add friend(peter) 
peter.add friend(mary) 


13.2 ”广度 优先 搜索 
LinkedIn 也 是 一 个 流行 的 社交 网 络 ， 其 专注 于 职业 社交 。LinkedIn 的 一 个 有 名 的 功能 就 是 ， 
你 除了 能 够 看 到 自己 直接 添加 的 联系 人 ， 还 可 以 发 所 你 的 二 度 、 三 度 联系 人 。 


如 图 所 示 ，Alice 能 直接 联系 到 Bob，Bob 能 直接 联系 到 Cynthia。 但 Alice 无 法 直接 联系 到 
Cynthia。 由 于 她 们 之 间 的 联系 要 经 过 Bob ， 因 此 Cynthia 是 Alice 的 二 度 联系 人 。 


CD — OO—® 


如 果 我 们 想 查 看 Alice 的 整个 关系 网 ， 包 括 她 那些 间接 的 关系 ， 需 要 怎么 做 呢 ? 


图 有 两 种 经 典 的 遍历 方式 : 广度 优先 搜索 和 深度 优先 搜索 。 在 此 我 们 会 研究 广度 优先 搜索 ， 
深度 优先 搜索 你 可 以 自己 去 学 习 。 两 者 是 相似 的 ， 并 且 在 大 多 数 情况 下 都 一 样 好 用 。 
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广度 优先 搜索 算法 需要 用 队列 ( 参见 第 8 章 ) 来 记录 后 续 要 处 理 哪些 顶点 。 该 队列 最 初 只 含 
有 起 步 的 顶点 〈 对 本 例 来 说 ， 就 是 Alice )。 于 是 算法 一 开始 ， 我 们 的 队列 如 下 所 示 。 


[ALice] 











然后 处 理 Alice 顶点 。 我 们 将 其 移出 队列 ， 标 为 “已 访问 ”， 并 记 为 当前 顶点 。( 很 快 我 们 就 
会 走 一 遍 整 个 流程 ， 让 你 看 得 更 明白 一 些 。) 


接着 按照 以 下 3 步 去 做 。 


(1) 找 出 当前 顶点 的 所 有 邻接 点 。 如 果 有 哪个 是 没 访问 过 的 ， 就 把 它 标 为 “已 访问 ”， 并 且 将 
它 人 队 。( 尽 管 该 顶点 并 未 作为 “当前 顶点 ”被 访问 过 。) 


(2) 如 果 当 前 顶点 没有 未 访问 的 邻接 点 ， 且 队列 不 为 空 ， 那 就 再 从 队列 中 移出 一 个 顶点 作为 
当前 顶点 。 


(3) 如 果 当 前 顶点 没有 未 访问 的 邻接 点 ， 且 队列 里 也 没有 其 他 顶点， 那么 算法 完成 。 
下 面 来 实际 演示 一 遍 。Alice 的 LinkedIn 关系 网 如 下 图 所 示 。 


“uD 的 GD 古 


三 度 联系 人 一 > Geo) ren) 


首先 ， 将 Alice 设 为 当前 顶点 。 为 了 在 图 中 表示 她 是 当前 顶点 ,我 们 用 线段 将 其 围绕 。 为 了 
表示 Alice 已 被 访问 ， 我 们 在 她 旁边 打 了 个 钩 。 继 续 该 算法 ， 找 出 一 个 未 访问 的 邻接 点 一 一 本 例 
中 的 Bob， 在 他 名 字 旁 边 打 个 多 ,如 下 图 所 示 。 
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我 们 也 将 Bob 入 队 , 使 队列 变 为 [Bob] 。 这 意味 着 Bob 未 曾 作为 当前 项 点。 注意 , 虽然 当前 
顶点 是 Alice,， 但 我 们 也 能 访问 Bob。 


接着 , 检查 当前 顶点 Alice 是 否 还 有 未 访问 的 邻接 点 。 发 现 有 Candy， 于 是 将 其 标 为 已 访问 。 























现在 队列 为 [Bob，Candy] 。 
Alice 还 有 邻接 点 Derek 没 访问 过 ， 于 是 访问 他 。 





现在 队列 为 [Bob，Candy，Derek] 。 
Alice 还 有 一 个 未 访问 的 关系 Elaine， 于 是 我 们 也 要 访问 她 。 
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现在 队列 为 [Bob，Candy，Derek，ELaine]。 
因为 Alice 已 经 没有 未 访问 的 邻接 点 了 ， 所 以 执行 本 算法 的 第 2 条 规则 ， 从 队列 里 移出 一 个 



































顶点 ， 把 它 设 为 当前 顶点 。 回 想 第 8 章 提 到 的 ， 队 列 只 能 在 队 头 移 除数 据 ， 于 是 现在 要 移出 的 就 
征 Bob。 
现在 队列 变 为 [Candy，Derek，Elaine] ，Bob 成 为 了 当前 顶点 。 





然后 回 到 第 1 条 规则 ， 找 出 当前 顶点 的 所 有 未 访问 的 邻接 点 。Bob 有 一 个 邻接 点 Fred， 于 是 
将 他 标记 为 已 访问 ， 并 把 他 加 入 队列 。 








现在 队列 为 [Candy，pDerek，ELaine，Fred]。 
因为 Bob 没 有 其 他 未 访问 的 邻接 点 了 ， 所 以 出 队 一 个 顶点 一 一 Candy 一 一 作为 当前 顶点 。 
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然而 Candy 没有 未 访问 的 邻接 点 。 于 是 再 从 队列 中 拿 出 一 个 顶点 Derek 一 一 使 得 队列 变 
成 [Elaine, Fred]。 








现在 队列 为 [ELaine，Fred，Gina]。 
Derek 没有 邻接 点 需要 访问 了 ， 于 是 我 们 从 队列 里 拿 出 Elaine， 将 她 标记 为 当前 顶点 。 








Elaine 没有 未 访问 的 邻接 点 ， 于 是 从 队列 中 拿 出 Fred。 


13.2 ”广度 优先 搜索 141 








此 时 队列 变 为 [Gina] 。 
Fred 有 一 个 联系 人 要 访问 一 Helen 一 一 于 是 将 其 标 为 已 访问 ， 并 且 人 和 人 队 ， 使 队列 变 成 [Gina， 


Helen]。 














现在 队列 里 只 剩 [Helen] 了 。 





Gina 有 一 个 邻接 点 要 访问 





lrena。 
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现在 队列 为 [Helen，Irena]。 


Gina 没有 其 他 关系 需要 访问 了 , 所 以 让 Helen 出 队 , 将 她 设 为 当前 顶点 ， 于 是 队列 里 剩 下 的 
是 [Irena]。Helen 没 有 什么 人 需要 访问 , 于 是 我 们 让 Irena 出 队 , 将 她 设 为 当前 顶点 。 因 为 Irena 
没有 顶点 需要 访问 ， 而 且 队 列 空 了 ， 所 以 算法 结束 ! 


我 们 在 Person 类 里 加 上 display_network 方法 ， 以 广度 优先 搜索 的 方式 展示 一 个 人 的 关 
系 网 里 所 有 的 名 字 。 


class Person 























attr_accessor :name, :friends, :visited 


def initialize(name) 
Gname = name 
@friends [] 
@visited = false 
end 


def add friend(friend) 
@friends << friend 
end 


def display _ network 
人 ## 记 下 每 个 访问 过 的 人 ， 以 便 算法 完结 后 能 重 置 他 们 的 Visited 属性 为 false 
to_ reset = [self] 


# 创建 一 个 开始 就 含有 根 顶 点 的 队列 
queue = [self] 
self.visited = true 


while queue.any? 
# 设 出 队 的 顶点 为 当前 顶点 
current vertex = queue.shift 
puts current vertex.name 


# 将 当前 顶点 的 所 有 未 访问 的 邻接 点 加 入 队列 
current vertex.friends.each do |friend| 
if !friend.visited 
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to_reset << friend 
dueue << friend 
friend.visited = true 
end 
end 
end 


# 算法 完结 时 ， 将 访问 过 的 结 点 的 Visited 属性 重 置 为 faLse 
to_reset.each do |nodel 
node.visited = false 
end 
end 


end 





为 了 使 它 运作 起 来 , 我 们 还 给 Person 类 增加 了 visited 属性 , 来 记录 一 个 人 在 本 次 搜索 中 
是 否 已 被 访问 。 


将 算法 的 步骤 分 为 两 类 之 后 ， 我 们 可 以 看 出 图 的 广度 优先 搜索 的 效率 。 








口 让 顶点 出 队 ， 将 其 设 为 当前 顶点 。 
D 访问 每 个 顶点 的 邻接 点 。 
这 样 看 来 ， 每 个 顶点 都 会 有 一 次 出 队 的 经 历 。 以 大 O 记 法 表示 ， 就 是 0( 了 ,意思 是 有 了 个 


顶点 ， 就 有 大 次 出 队 。 


既然 要 处 理 N 个 顶点 ,不 应 该 表示 为 OOV) 吗 ? 不 是 的 ， 因 为 在 此 算法 〈 以 及 很 多 其 他 图 的 


算法 ) 中 ， 除 了 处 理 顶 点 本 身 ， 还 得 处 理 边 ， 下 面 就 来 解释 。 
我 们 观察 一 下 访问 邻接 点 需要 多 少 
以 当前 顶点 为 Bob 的 时 候 为 例 。 


此 时 我 们 会 运行 如 下 代码 。 


current vertex.friends.each do |friend| 
if !friend.visited 
queue << friend 
friend.visited = true 
end 
end 





就 是 说 , 我 们 会 访问 Bob 所 有 的 邻接 点 ,其 中 不 但 有 Fred, 还 有 Alice! 尽管 她 曾 被 访问 过 ， 
不 用 再 入 队 ， 但 访问 她 还 是 增加 了 一 次 each 循环 。 


























要 是 你 再 认真 地 运行 一 遍 整 个 广度 优先 搜索 的 流程 ,你 会 发 现 访问 邻接 点 所 用 的 步 数 , 是 图 


中 边 数 的 两 倍 。 因 为 一 条 边 连 接着 两 个 顶点 ， 对 于 每 个 项 点， 我 们 都 要 访问 其 所 有 邻接 点 。 所 以 [ 
每 条 边 都 会 被 使 用 两 次 。 














因此 ， 有 瓦 条 边 ， 就 会 有 2E 步 来 访问 邻接 点 ， 即 每 对 邻接 点 都 会 被 访问 两 次 。 不 过 由 于 大 
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0 忽略 常数 ， 所 以 只 写作 OP)。 
因为 广度 优先 搜索 有 O( 肋 次 出 队 ， 还 有 O(E) 次 访问 ， 所 以 我 们 说 它 的 效率 为 O(V+ 5)。 


13.3 ”图 数据 库 


因为 图 擅长 处 理 关 系 信息 , 所 以 有 些 数 据 库 就 以 图 的 形式 来 存储 数据 。 传统 的 关系 型 数据 库 
(以 行 和 列 的 形式 保存 数据 的 数据 库 ) 也 能 存储 这 类 信息 ， 我 们 不 妨 比 较 一 下 它们 处 理 社交 网 络 
之 类 的 数据 时 的 表现 。 

假设 有 一 个 5 人 的 社交 网 络 , 分 别 是 Alice 、Bob 、Cindy 、Dennis 和 Ethel， 他 们 互相 都 有 联 
系 。 保 存 他 们 个 人 信息 的 图 数据 库 大 概 会 如 下 图 所 示 。 


















Alice Adams 





alice@example.net 
555-111-1111 












Bob Block 
bobGexamptLe ,net 
555-222-2222 





Dennis Dimberg 





dennis@example.net 
555-444-4444 






Cindy Clyde 
cindy@example.net 
555-333-3333 


Ethel Emory 
ethel@example.net 
555-555-5555 































































这 种 信息 也 可 以 用 关系 型 数据 库 来 存储 。 那 得 需要 两 张 表 一 一 一 张 保存 个 人 信息 , 另 一 张 保 
存 朋 友 关 系 。 以 下 是 Users 表 。 
Users 表 
id | firstname lastname email | phone 
1 | Alice Adams alice@example.net | 555-111-1111 
2 | Bob Block | bobeexampte.net |555-222-2222 
3 | Cindy CLyde cindy@example.net | 555-333-3333 
4 | Dennis Dimberg |dennis@example.net | 555-444-4444 
5 | Ethel Emory ethel@example.net |555-555-5555 
另 一 张 Friendships 表 记 录 着 谁 是 谁 的 朋友 。 
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Friendships 表 
user_id friend id 


1 2 所 一 Alice 跟 Bob 是 朋友 
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我 们 不 会 太 过 深入 地 研究 数据 库 理 论 ， 但 你 得 知道 在 Friendships 表 中 只 需 以 用 户 id 来 指 代 
用 户 。 

如 果 这 个 社交 网 络 允 许 用 户 查 看 其 朋友 的 全 部 信息 , 而 Cindy 也 正 要 这 么 做 , 那 意味 着 她 想 
看 到 一 切 关 于 Alice 、Bob 、Dennis 和 Ethel 的 信息 ， 包 括 他 们 的 邮件 地 址 和 电话 号 码 。 


那 我 们 就 来 看 看 以 关系 型 数据 库 为 后 端的 应 用 会 怎样 执行 她 的 请 求 。 首先 , 我 们 得 找 出 User 
表 中 Cindy 的 id。 














Users 表 
id firstname | Lastname email phone 
3 Cindy Clyde cindy@example.net |555-333-3333 
Cindy 的 id 
然后 ， 找 出 Friendships 表 中 所 有 user id 为 3 的 行 。 
Friendships 表 
user_id friend_id 














Cindy Cindy 的 朋友 
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我 们 就 得 到 了 Cindy 朋友 的 id 列表: [1，2，4，5]。 


有 了 id 列表 之 后 ,我 们 还 得 回 Users 表 找 出 这 些 id 对 应 的 行 。 计算机 从 Users 表 查 找 一 行 的 
速度 大 概 是 O(log N)。 因 为 数据 库 中 的 行 会 按照 id 的 顺序 来 维护 ,所 以 我 们 可 以 用 二 分 查找 来 找 
出 id 对 应 的 行 。( 以 上 解释 只 适用 于 部 分 关系 型 数据 库 ， 其 他 关系 型 数据 库 可 能 有 不 同 做 法 。) 


Cindy 有 4 个 朋友 , 所 以 计算 机 需要 做 4 次 O(log N) 查 询 才 能 提取 出 她 全 部 朋友 的 个 人 信息 。 
推广 开 来 ， 若 有 M 个 朋友 ,那么 提取 他 们 个 人 信息 的 效率 就 为 OCUM 1log N)。 换 句 话说， 对 于 每 个 
朋友 ， 都 要 执行 一 次 步 数 为 log N 的 搜索 。 

相 比 之 下 ， 后 端 为 图 数据 库 时 ， 一 旦 在 数据 库 中 定位 到 Cindy， 那 么 只 需 一 步 就 能 碍 到 她 任 
一 朋友 的 信息 。 因 为 数据 库 中 的 每 个 项 点 已 经 包含 了 该 用 户 的 所 有 信息 , 所 以 你 只 需 遍 历 那 些 连 
接 Cindy 与 朋友 的 边 即 可 。 如 下 图 所 示 ， 总 共 也 就 4 步 。 
































ALice Adams 
alice@example.net 
555-111-1111 






Bob Block 
bob@example.net 
555-222-2222 





Cindy Clyde 
cindy@example.net 
555-333-3333 















Dennis Dimberg 
dennis@example.net 
555-444-4444 


Ethel Emory 
ethel@example.net 
555<555-5555 


用 图 数据 库 的 话 , 有 N 个 朋友 就 需要 O(N) 步 去 获取 他 们 的 数据 , 与 关系 型 数据 库 的 OUM log NM) 
相 比 ， 确 实 是 极 大 的 效率 提升 。 

Neo4j 是 开源 的 图 数据 库 中 比较 受 欢迎 的 一 个 。 我 建议 你 上 它 的 官网 去 了 解 更 多 关于 图 数据 
库 的 知识 。 其 他 开源 的 图 数据 库 还 有 ArangoDB 和 Apache Giraph。 

但 记 住 ， 图 数据 库 也 并 不 总 是 最 好 的 解决 方案 。 你 得 谨慎 地 评估 每 个 应 用 场景 的 需求 再 做 
选择 。 












































13.4 ”加 权 图 
还 有 一 种 图 叫 作 加 权 图 。 它 跟 普 通 的 图 类 似 ， 但 边 上 带 有 信息 。 
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以 下 这 个 包含 了 美国 几 个 主要 城市 的 简陋 地 图 ， 就 是 一 个 加 权 图 。 





Los 
Angeles 


此 图 中 , 每 条 边 上 都 有 一 个 数字 , 它 表 示 那 条 边 所 连接 的 两 个 城市 相距 多 少 英里 。 例 如 ，Chicago 
和 New York City 之 间 的 距离 为 714 英里 。 


加 权 图 可 以 是 有 方向 的 。 以 下 图 为 例 ， 尽 管 从 Dallas 飞 到 Toronto 只 要 138 美元 ,但 从 Toronto 


飞 到 Dallas 要 216 美元 。 


要 往 图 里 加 上 权重 ， 得 稍微 更 改 一 下 我 们 的 Ruby 代码 。 具 体 来 说 ， 我 们 要 把 表示 邻接 点 的 
数组 换 成 散 列 表 。 对 于 上 图 来 说 ， 一 个 顶点 就 是 一 个 City 类 的 对 象 。 
class City 
attr_accessor :name, :routes 


def initialize(name) 
Gname = name 
# 把 表示 邻接 点 的 数组 换 成 散 列表 
GQroutes = {} 

end 


def add route(city, price) 
@routes[city] = price 
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end 
end 
这 样 就 可 以 创建 城市 和 不 同 价格 的 航线 了 。 


dallas = City.new("Dallas") 
toronto = City.new("Toronto") 








dallas.add route(toronto, 138) 
toronto.add route(dallas, 216) 


我 们 可 以 借助 加 权 图 来 解决 最 短路 径 问题 。 




















下 图 展示 了 5 个 城市 之 间 的 航线 价格 。( 别 问 我 航空 公司 是 怎么 定价 的 ! ) 


$180 














假设 我 目前 身 在 Atlanta， 想 飞 去 El Paso。 不 幸 的 是 ， 现 在 没有 直达 航班 。 然 而 ， 我 也 可 以 
在 其 他 城市 转机 过 去 。 例 如 ， 先 从 Atlanta 到 Denver， 再 从 Denver 到 El Paso。 这 会 花费 300 美 
元 。 但 再 看 仔细 一 点 ， 你 会 发 现 从 Atlanta 沿 Denver、Chicago 再 到 El Paso 会 更 加 便宜 。 虽 然 多 
转 一 次 ， 但 只 需 花 280 美元 。 

这 就 是 一 种 最 短路 径 问 题 : 如 何以 最 低 的 价钱 从 Atlanta 飞 往 El Paso。 














13.5 “Dijkstra 算法 

解决 最 短路 径 问 题 的 算法 有 好 几 种 ， 其 中 一 种 有 趣 的 算法 是 由 Edsger Dijkstra ( 念 为 “dike， 
struh”) 于 1959 年 发 现 的 。 该 算法 也 很 自然 地 被 称 为 Dijkstra 算法 。 

Dijkstra 算 法 的 规则 如 下 ( 别 担心 ， 之 后 我 们 跟着 例子 运行 一 遍 就 会 更 明白 了 )。 











(1) 以 起 步 的 顶点 为 当前 顶点 。 
(2) 检查 当前 顶点 的 所 有 邻接 点 ， 计 算 起 点 到 所 有 已 知 顶 点 的 权重 ， 并 记录 下 来 。 
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点 ， 作 为 下 一 个 当前 顶点 


(4) 重复 前 3 步 ， 直 至 图 中 所 有 顶点 都 被 访问 六 
下 面 来 一 步 步 地 运行 一 遍 整 个 算法 








我 们 用 以 下 表格 来 记录 Atlanta 到 其 他 城市 最 便 1 
从 Atlanta 到 : 





宜 的 价格 。 
Boston Chicago Denver El Paso 
? : 





首先 , 以 起 步 项 点 ( Atlanta ) 作为 当前 顶点 。 此 时 我 们 能 访问 的 就 是 当前 顶点 以 及 其 邻接 点 。 
为 指明 哪个 点 是 当前 项 点 , 我 们 以 线段 将 其 围绕 。 为 指明 哪些 点 曾 作 为 当前 项 点, 我 们 给 它们 打 
上 钩 。 












































$100 
$160 坏 > Se 
接着 检查 所 有 邻接 点 , 记 下 从 起 点 ( Atlanta ) 到 所 有 已 知 地 点 的 权重 。 可见 从 Atlanta 到 Boston 
是 100 美元， 从 Atlanta 到 Denver 是 160 美元 ， 于 是 记录 到 表格 里 。 
从 Atlanta 到 : Boston Chicago Denver El Paso 
100 7 160 ? 
接着 从 Atlanta 可 到 达 但 又 未 访问 过 的 顶点 中 ， 找 出 最 便宜 的 那个 。 就 目前 所 知 ， 从 Atlanta 
出 发 可 以 到 达 Boston 和 Denver， 并 且 Boston ( 100 美元 ) 比 Denver ( 160 美元 ) 更 便宜 。 因 此 
选择 Boston 作为 当前 顶点 


$180 






My 
> < 一 
二 二 eostoy 让 = 


-eS 


$100 


$160 
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然后 检查 从 Boston 出 发 的 航线 ， 更 新 从 起 点 Atlanta 到 所 有 已 知 地 点 的 花费 。 我 们 看 到 
Boston 到 Chicago 是 120 美元 。Atlanta 到 Boston 是 100 美元 ，Boston 到 Chicago 是 120 美元 , 所 
以 从 Atlanta 到 Chicago 最 便宜 的 ( 而 且 是 目前 唯一 的 ) 路 线 要 220 美元 。 我 们 把 它 记 在 表 里 。 


从 Atlanta 到 : Boston Chicago Denver EI Paso 
100 220 160 ? 




































































再 看 看 从 Boston 出 发 的 另 一 条 航线 一 一 Denver 一 一 要 180 美元 。 于 是 我 们 又 发 现 了 一 条 从 
Atlanta 到 Denver 的 路 线 : Atlanta 到 Boston 再 到 Denver。 不 过 这 条 路 线 要 280 美元 ， 而 Atlanta 
直 飞 Denver 才 160 美元 ， 所 以 无 须 更 新 价格 表 ， 毕 竞 我 们 只 想 记 录 最 便宜 的 路 线 。 


既然 从 当前 顶点 ( Boston ) 出 发 的 航线 都 已 探索 过 了 ， 就 得 找 下 一 个 从 起 点 Atlanta 所 能 到 

达 的 最 便宜 的 未 访 点 了 。 根据 表格 来 看 ， 最 便宜 的 还 是 Boston, 但 它 已 经 打 过 钧 了 。 这样 最 便宜 

的 未 访问 城市 应 该 是 Denver 了 , 因为 与 220 美元 的 Chicago 相 比 , 它 只 要 160 美元 。 于 是 Denver 
变 成 了 当前 项 点。 
































$180 


Ge 


CC 
~ $100 
$140 


$160 











那么 我 们 就 来 观察 由 Denver 出 发 的 航线 ， 其 中 一 条 从 Denver 到 Chicago 的 航线 是 40 美元。 
于 是 我 们 可 以 更 新 Atlanta 到 Chicago 的 最 低 价格 了 。 因 为 现在 的 价格 表 里 Atlanta 到 Chicago 要 
220 美元 ， 但 大 经 Denver 转机 ， 则 只 需 200 美元 。 所 以 更 新 一 下 表格 。 


从 Atlanta 到 : Boston Chicago Denver El Paso 
100 200 160 7 








从 Denver 飞 出 的 航班 还 有 一 个 ， 它 的 目的 地 是 El Paso。 我 们 要 计算 Atlanta 到 El Paso 的 最 
低 价格 ， 目 前 只 能 从 Atlanta 到 Denver 再 到 El Paso， 共 300 美元 。 将 价钱 记 下 。 





从 Atlanta 到 Boston Chicago Denver EI Paso 
100 200 160 300 
现在 还 没 访问 0 : Chicago 和 Hl Atlanta | Py (200 美元 ) 
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$180 
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MW 

















Chicago 只 有 一 个 出 发 航班 : 80 美元 到 El Paso。 于 是 Atlanta 到 El Paso 路 线 的 最 低 价格 得 
以 更 新 : 从 Atlanta 到 Denver， 再 到 Chicago， 最 后 抵达 El Paso， 总 共 花 费 280 美元 。 我 们 把 
世 记 下 。 






































从 Atlanta 到 : Boston Chicago Denver El Paso 
100 200 160 280 
最 后 只 剩 一 个 城市 可 作为 当前 顶点 了 ， 那 就 是 El Paso。 


$180 








El Paso 只 有 一 个 出 发 航班 : 100 美元 飞 到 Boston。 这 并 没 刷 新 Atlanta 到 其 他 地 方 的 最 低 价 ， 
所 以 我 们 无 须 更 新 价格 表 。 


现在 所 有 顶点 都 访问 过 了 ， 这 就 意味 着 Atlanta 到 其 他 城市 的 所 有 路 径 都 已 发 据 。 于 是 算法 
结束 ， 我 们 也 可 以 从 价格 表 得 知 从 Atlanta 到 地 图 上 任 一 城市 的 最 低 价格 了 。 
从 Atlanta 到 : Boston Chicago Denver El Paso 








100 200 160 280 证 


以 下 是 Dijkstra 算法 的 Ruby 实现 。 
我 们 先 创 建 一 个 代表 城市 的 Ruby 类 。 一 个 城市 就 是 图 上 的 一 个 结 点 ， 它 记 有 自己 的 名 字 以 

















152 第 13 章 连接 万 物 的 图 





及 可 到 达 的 城市 。 
class City 


attr_accessor :name, :routes 


def initialize(name) 
Gname = name 
# 把 表示 邻接 点 的 数组 换 成 散 列 表 
@routes = {} 
## 如 果 此 城市 是 AtLanta， 则 散 列 表 应 包含 : 
# {boston => 100, denver => 160} 
end 


def add route(city, price info) 
@routes[city] = price info 
end 


end 


然后 用 add_route 来 建立 城市 间 的 航线 。 


atlanta = City.new("Atlanta") 
boston = City.new("Boston") 
chicago = City.new("Chicago") 
denver = City.new("Denver") 
el paso = City.new("ElL Paso") 





atlanta.add route(boston, 100) 
atlanta.add route(denver, 160) 
boston.add route(chicago, 120) 
boston.add route(denver, 180) 
chicago.add route(el paso, 80) 
denver.add route(chicago, 40) 
denver.add route(el paso, 140) 


Dijkstra 算法 的 代码 是 有 点 复杂 的 ， 所 以 我 在 每 一 步 都 做 了 注释 。 


def dijkstra(starting city, other cities) 
# 散 列表 routes from_city 用 来 保存 从 给 定 城市 到 其 他 所 有 城市 的 价格 
# 以 及 途经 的 城市 
routes from city = {} 
# 它 的 格式 如 下 : 
人 ## {终点 城市 => [价格 ， 到 达 终 点 城市 前 所 要 经 过 的 那个 城市 ]} 





## 以 上 图 为 例 ， 此 散 列 表 最 后 会 是 : 
# {atlanta => [0, nil], boston => [100, atlanta], chicago => [200，denver]， 
# denver => [160, atlanta], el paso => [280, chicago]} 


# 从 起 点 城市 到 起 点 城市 是 免费 的 
routes from city[starting city] = [0, staring city] 


# 初始 化 该 散 列 表 时 ， 因 为 去 往 所 有 其 他 城市 的 花费 部 未 知 ， 所 以 先 设 为 无 限 
other cities.each do |city| 
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routes from city[city] = [Float::INFINITY, nil] 
end 
## 以 上 图 为 例 ， 此 散 列表 起 初 会 是 : 
# {atlanta => [0, nil], boston => [Float::INFINITY, nil], 
# chicago => [Float::INFINITY, nil], 
# denver => [Float::INFINITY, nil], el paso => [Float::INFINITY, nil]} 


# 已 访问 的 城市 记录 在 这 个 数组 里 
visited cities = [] 


# 一 开始 先 访问 起 点 城市 ， 将 CUrrent _city 设 为 它 
current city = starting city 


# 进入 算法 的 核心 逻辑 ， 循 环 访问 每 个 城市 
while current city 


# 正式 访问 当前 城市 
visited cities << current city 


# 检查 从 当前 城市 出 发 的 每 条 航线 
current city.routes.each do |city, price _ infol| 
# 如 果 起 点 城市 到 其 他 城市 的 价格 比 routes from city 所 记录 的 更 低 ， 
# 则 更 新 记录 
if routes from city[city][0] > price info + 
routes from city[current city][0] 
routes from city[city] = 
[price info + routes from city[current city][0], current city] 
end 
end 


# 决定 下 一 个 要 访问 的 城市 
current city = nil 
cheapest route from current city = Float::INFINITY 
# 检查 所 有 已 记录 的 路 线 
routes from city.each do |city, price info| 
# 在 未 访问 的 城市 中 找 出 最 便宜 的 那个 ， 
# 设 为 下 一 个 要 访问 的 城市 
if price info[0] < cheapest route from current city && 
Ivisited _ cities.inctude?(city) 
cheapest route _ from current city = price info[0] 
current city = city 
end 
end 
end 











return routes from city 
end 


该 方法 可 以 这 样 使 用 : 
routes = dijkstra(atlanta, [boston, chicago, denver, el paso]) 
routes.each do |city, price info| 


p "#{city.name}: #{price info[0]}" 
end 
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虽然 这 个 例子 是 找 出 最 便宜 的 航线 ,但 其 解决 方法 也 适用 于 地 图 软件 和 GPS 技术 。 如 果 边 
上 的 权重 不 是 表示 价格 ， 而 是 表示 行车 用 时 ， 那 就 可 以 用 Dijkstra 算 法 来 确定 从 一 个 城市 去 男 
个 城市 应 该 走 哪 条 路 线 。 




















13.6 总 结 


这 一 章 讲 的 是 本 书 最 后 一 种 重要 的 数据 结构 , 我 们 的 学 习 之 旅 也 接近 了 尾声 。 我 们 知道 了 图 
是 处 理 关系 型 数据 的 强大 工具 ， 它 除了 能 让 代码 跑 得 更 快 ， 还 能 帮忙 解决 一 些 复杂 的 问题 。 
学 习 至 今 ， 我们 关注 的 主要 是 代码 运行 的 速度 。 我 们 以 时 间 和 算法 的 步 数 来 衡量 代码 的 
性 能 。 

然而 ,性 能 的 衡量 方法 不 止 这 些 。 在 某 些 情况 下 ,还 有 比 速度 更 重要 的 东西 ， 比 如 我 们 可 能 
更 关心 一 种 数据 结构 或 算法 会 消耗 多 少 内 存 。 下 一 章 , 我 们 就 来 学 习 如 何 分 析 一 段 代码 在 空间 上 
的 效率 。 


























对 付 空间 限制 











本 书 至 此 ,在 分 析 各 种 算法 的 效率 时 , 我们 只 关注 了 它们 的 时 间 复 杂 度 。 换 句 话说 ,就 是 它 
们 运行 得 有 多 快 。 但 有 些 时 候 , 我 们 还 得 以 另 一 种 名 为 空间 复杂 度 的 度量 方式 ， 去 估计 它们 会 消 
耗 多 少 内 存 。 

当 内 存 有 限时 , 空间 复杂 度 便 会 成 为 选择 算法 的 一 个 重要 的 参考 因素 。 比 如 说 , 在 给 小 内 存 
的 小 型 设备 写 程序 时 ， 或 是 处 理 一 些 会 迅速 占 满 大 内 存 的 大 数据 时 都 会 考虑 空间 复杂 度 。 

既 省 时 又 省 内 存 的 算法 当然 是 最 理想 的 。 但 有 些 情 况 下 我 们 却 只 能 二 者 选 其 一 , 这 时 要 想 做 
出 正确 选择 ， 就 得 仔细 分 析 了 。 


14.1 描述 空间 复杂 度 的 大 O 记 法 

有 趣 的 是 ， 计 算 机 科学 家 还 是 用 描述 时 间 复 杂 度 的 大 O 记 法 来 描述 空间 复杂 度 。 

至 今 我 们 一 直 这 样 用 大 O 记 法 来 描述 一 个 算法 的 速度 : 当 所 处 理 的 数据 有 N 个 元 素 时 ， 该 
算法 所 需 的 步 数 相对 于 元 素数 量 是 多 少 。 例 如 ，O(N) 算 法 就 是 处 理 N 个 元 素 需 要 V 步 的 算法 。 
O(N”) 算 法 就 是 处 理 N 个 元 素 需 要 NN" 步 的 算法 。 

类 似 地 , 我 们 也 可 以 用 大 0 来 描述 一 个 算法 需要 多 少 空间 : 当 所 处 理 的 数据 有 N 个 元 素 时 ， 
该 算法 还 需 额外 消耗 多 少 元 素 大 小 的 内 存 空间 。 让 我 们 看 一 个 简单 的 例子 。 

假设 要 写 一 个 JavaScript 函数 ， 它 接收 一 个 字符 串 数 组 ， 并 返回 一 个 含有 那些 字符 串 的 大 写 
形式 的 数组 。 如 果 接 收 的 数组 是 ["amy"，"bob"，"cindy"，"derek"] , 那么 返回 的 就 是 ["AMY" ， 
"BOB"，"CINDY"， "DEREK"] 。 以 下 是 该 函数 的 一 种 写法 。 


function makeUpperCase(array) { 






















































































var newArray = []; 

for(var i = 0; i < array.length; i++) { 
newArray[i] = array[lil].toUpperCase(); 

} 

return newArray; 


} 
makeUpperCase 函数 接收 一 个 数组 作为 参数 array。 然后 它 创建 了 一 个 全 新 的 数组 , 名 为 newArray， 
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并 将 原 数 组 array 里 的 字符 串 的 大 写 形式 填 进 去 。 
等 到 该 函数 结束 的 时 候 , 内 存 里 会 存在 两 个 数组 , 一 个 是 array, 它 里 面 是 ["amy"，, "bob"， 
"cindy"，"derek"]; 另 一 个 是 newArray， 它 里 面 是 ["AMY"， "BOB"，"CINDY"，"DEREK"] 。 
分 析 该 函数 的 话 ， 你 会 发 现 它 接收 一 个 N 元素 的 数组 ， 就 会 产生 另 一 个 新 的 N 元 素数 组 。 
因此 ， 我 们 会 说 这 个 makeUpperCase 函数 的 空间 效率 是 O(N)。 


这 种 复杂 度 的 图 应 该 很 熟悉 了 。 
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注意 它 的 画 法 跟前 面 章节 的 OWW) 是 一 样 的 , 只 是 这 次 的 纵 坐 标 不 是 代表 速度 , 而 是 代表 内 存 。 
我 们 再 写 一 个 更 高 效 利 用 内 存 的 makeUpperCase。 


function makeUpperCase(array) { 
for(var i = 0; i < array.length; i++) { 
array[i] = array[il].toUpperCase(); 
外 


return array 


} 

在 这 第 二 个 版 本 里 , 我 们 没有 创建 任何 新 的 变量 或 新 的 数组 , 也 确实 没有 消耗 额外 的 内 存 空 
间 。 我 们 只 是 变动 了 原 array 里 的 每 个 字符 串 ， 将 它们 逐一 换 成 大 写 。 最 后 返回 这 个 修改 过 的 
array。 

因为 该 函数 并 不 消耗 额外 的 内 存 空间 ， 所 以 我 们 把 它 的 空间 复杂 度 描述 为 0(1)。 记 住 , 时 间 
复杂 度 的 0(1) 意 味 着 一 个 算法 无 论处 理 多 少数 据 ， 其 速度 恒定 。 相 似 地 ， 空 间 复杂 度 的 0(1) 则 
意味 着 一 个 算法 无 论处 理 多 少数 据 ， 其 消耗 的 内 存 恒定 。 

刚才 的 例子 中 , 无 论 传 入 的 array 包含 4 个 元 素 还 是 100 个 元 素 , 该 算法 所 需 的 额外 的 空间 
都 一 样 (为 零 )。 因 此 ， 我 们 认为 新 版 的 makeUpperCase 的 空间 效率 是 O()。 

值得 一 再 强调 的 是 , 空间 复杂 度 是 根据 额外 需要 的 内 存 空间 ( 也 叫 辅助 空间 ) 来 算 的 ， 也 就 
是 说 原本 的 数据 不 纳入 计算 。 尽 管 在 第 二 个 版 本 里 我 们 有 array 这 一 和 人 参 ， 占 用 了 N 个 元 素 的 
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空间 ， 但 除 此 之 外 它 并 没有 消耗 额外 的 内 存 ， 所 以 它 是 0(1)。 


(有些 参考 书 在 计算 空间 复杂 度 时 是 连 原始 输入 也 一 起 算 的 ， 那 没 问题 。 但 此 处 我 们 不 计算 
， 当 你 在 其 他 地 方 看 到 某 一 算法 的 空间 复杂 度 的 描述 时 , 最 好 留意 一 下 它 是 否 计算 原始 输入 。) 


我 们 比较 一 下 makeUpperCase 两 个 版 本 的 时 间 复 杂 度 和 空间 复杂 度 





























版 ”本 时 间 复 杂 度 空间 复杂 度 
1 OO CU 
2 O(N) CO) 

















因为 Y 项 数据 要 花 N 步 去 处 理 ， 所 以 两 个 版 本 的 时 间 复 杂 度 都 是 O(N)。 然 而 在 空间 复杂 度 
方面 ,第 二 个 版 本 只 有 O()， 与 第 一 个 版 本 的 O(N) 相 比 ， 它 对 内 存 的 使 用 效率 更 高 。 


因此 选择 第 二 个 版 本 更 为 合理 。 














14.2 ”时 间 和 空间 之 间 的 权衡 
第 4 章 我 们 写 了 一 个 用 于 检查 数组 是 否 含有 重复 值 的 JavaScript 函数 。 它 的 第 一 版 是 这 样 的 : 











function hasDuplicateValue(array) { 
for(var i = 0; i < array.length; i++) { 
for(var j = 0; j < array.length; j++) { 
if(i !== j && array[i] == array[j]) { 
return true; 
} 
} 
} 
return false; 


} 
它 用 了 起 套 循环 ， 时 间 复 杂 度 为 O(N”)。 
后 来 我 们 又 写 了 一 版 效率 更 高 的 ， 如 下 所 示 。 


function hasDuplicateValue(array) { 
var existingNumbers = []; 





for(var i = 0; i < array.length; i++) { 
if(existingNumbers[array[i]] === undefined) { 
existingNumbers[array[i]] = 1; 
} elLse 1 
return true; 
} 
上 
return false; 


} 
该 版 本 会 创建 一 个 名 为 existingNumbers 的 数组 , 然后 以 array 遇 到 的 每 个 数字 为 索引 ， 到 
existingNumbers 那里 找到 相应 的 格子 填 个 1。 如 果 相 应 的 格子 里 已 被 填 了 1， 则 可 知 该 数字 已 
经 存在 ， 证 明 有 重复 值 。 
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因为 与 第 一 版 的 O(N”) 相 比 , 它 的 时 间 复 杂 度 只 有 O(N), 所 以 我 们 宣称 它 胜 过 第 一 版 。 确 实 ， 
单 从 时 间 角 度 考虑 的 话 ， 第 二 版 是 更 快 的 。 

但 要 是 把 空间 也 考虑 进去 的 话 ， 你 会 发 现 它 与 第 一 版 相 比 有 一 缺点 。 第 一 版 除了 原 数组 ， 并 
不 会 消耗 额外 的 内 存 , 因此 它 的 空间 复杂 度 为 0(1)。 第 二 版 却 要 创建 一 个 与 原 数组 大 小 相等 的 全 
新 数组 ， 因 此 它 的 空间 复杂 度 为 O(N)。? 

我 们 来 给 两 个 版 本 的 hasDuplicateValue 做 个 全 面 的 对 比 。 














版 本 时 间 复 杂 度 空间 复杂 度 
1 O(N’) CUI) 
2 OW) O(N) 


可 见 第 一 版 所 用 的 内 存 更 少 , 但 跑 得 更 慢 , 第 二 版 虽 跑 得 快 但 用 的 内 存 更 多 。 那 要 怎么 决定 
该 用 哪个 呢 ? 

答案 当然 是 看 情况 。 如 果 你 想 要 程序 跑 得 超级 快 ， 而 且 你 的 内 存 十 分 充足 , 那么 用 第 二 版 会 
比较 好 。 但 如 果 你 不 看 重 速度 ， 而 且 你 的 程序 是 跑 在 需要 谨慎 使 用 内 存 的 吝 入 式 系统 上 , 那 你 应 
该 选择 第 一 版 。 所 有 技术 讨论 都 是 这 样 的 ， 当 需要 做 出 取舍 时 ， 你 应 从 全 局 看 待 问题 。 
































14.3” 写 在 最 后 的 话 


通过 这 次 学 习 之 旅 ,你 已 掌握 了 很 多 知识 ,其 中 最 重要 的 是 , 你 懂得 了 数据 结构 和 算法 的 分 
析 ， 这 对 代码 的 速度 、 内 存 占用 ， 甚 至 其 可 读 性 都 有 着 重大 影响 。 

在 此 书 中 你 收获 了 一 套 思路 清晰 的 技术 分 析 框 架 。 你 明白 了 计算 包含 各 种 细节 ， 尽 管 大 O 之 
类 的 理论 会 建议 你 哪 种 做 法 更 好 , 但 若 考 虑 其 他 因素 ,你 可 能 会 做 出 不 同 的 选择 。 机 器 对 内 存 的 
管理 方式 和 编程 语言 的 底层 实现 都 会 影响 程序 的 性 能 , 甚至 有 时 你 以 为 是 最 高 效 的 做 法 也 可 能 会 
随 着 外 部 环境 的 变化 而 变 得 低 效 。 

因此 , 你 最 好 时 刻 配 备 性 能 测试 工具 来 验证 你 的 调 优 是 否 有 效 。 测量 代码 速度 和 内 存 消耗 的 
优秀 工具 有 很 多 。 本 书 的 知识 只 告诉 你 调 优 的 方向 ， 而 测试 工具 会 负责 检验 你 调 优 的 具体 实现 是 
否 正确 。 

我 希望 你 能 通过 本 书 明白 一 个 道理 : 很 多 看 似 复杂 、 深 奥 的 事物 ， 其 实 都 是 由 你 所 掌握 的 简 
单 概 念 构筑 而 成 的 。 不 要 因为 某 些 资料 没 解释 到 位 ， 就 以 为 它 很 困难 而 被 吓 退 ,你 一 定 能 找到 更 
详尽 的 解释 资料 。 

数据 结构 和 算法 博大 精深 ,本 书 所 述 仅 为 皮毛 而 已 。 尽 管 需 要 学 习 的 东西 还 有 很 多 , 但 有 了 
目前 的 基础 ， 你 学 下 去 是 没 问 题 的 。 祝 你 好 运 ! 
































































































































@ 一 般 情 况 下 不 太 可 能 大 小 相等 ， 应 该 分 析 两 个 数组 的 稀 玻 程度 。 一 一 译 者 注 
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本 书 将 诸多 软件 开发 人 员 备 感 困惑 的 问题 精炼 出 来 ， 用 浅显 易 懂 的 方式 介绍 了 数据 
结构 与 算法 基础 知识 ， 握 弃 了 传统 参考 书 中 复杂 的 数学 公式 与 理论 ， 很 适合 期 望 提高 编 
程 水 平 的 程序 员 。 





一 一 Jason Pike 
Atlas REFID Solutions 高 级 软件 工程 师 


上 大 学 时 ， 我 觉得 “数据 结构 与 算法 ”这 门 读 太 枯燥 了 ， 教 材 厚 得 像 砖头 ， 满 纸 的 
概念 、 定 义 和 公式 。 现 在 的 读者 就 幸福 多 了 ， 有 了 这 样 一 本 可 读 性 非常 强 的 参考 指南 ， 
可 以 轻 轻松 松 就 把 该 了 解 的 知识 点 都 搞 清楚 。 





Nigel Lowry 
Lemmata 公 司 董 事 、 首 席 顾 问 





不 管 在 软件 开发 领域 是 新 手 还 是 老手 ， 学 习 、 温 习 基础 知识 都 会 受益 匪 浅 。 在 杰 
伊 . 温 格 罗 的 带领 下 畅游 数据 结构 与 算法 的 世界 ， 必 将 收获 恨 多 。 


一 一 上 evin Beam 
软件 工程 师 ， 任 职 于 美国 国家 冰雪 数据 中 心 和 科罗拉多 大 学 博 尔 德 分 校 
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看 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 编辑 或 作 
译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebook@turingbook.com。 
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